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(54) Title: NON-M NON-O HIV STRAINS, FRAGMENTS AND APPLICATIONS 
(54) Titre: SOUCHES DE VIH-1 NON-M NON~0, FRAGMENTS ET APPLICATIONS 
(57) Abstract 

The invention concerns retroviral strains of the group HIV-1, non-M 
non~0, particularly a strain called YBF30, its fragments and its applications as 
diagnosis reagent and as immunogenic agent. The HIV-2 different both from 
the group M and from the group O have the following characteristics: little or 
no serological response with respect to proteins of groups M and O and strong 
serological response with respect to proteins derived from the YBF30 strain or 
the SIV CPZGAB strain; absence of genomic amplification by the primers of 
regions env and gag of the HIV-1 -1 of groups M and O; genomic amplification 
in the presence of the primers derived from the YBF30 strain; and homology 
of the envelope gene products higher than 70 % with respect to the YBF30 
strain. 

(57) Abreg^ 

Souches de r6trovirus du groupe VIH-1, non-M non-O, notamment 
une souche d6nomm6e YBF30, ses fragments ainsi que ses applications, en 
tant que r6actif de diagnostic et en tant qu'agent immunogdne. Les VIH-1 
distincts ^ la fois du groupe M et du groupe O pr6sentent les caract6ristiques 
suivantes: pen ou pas de r6activit6 s6rologique vis-&-vis des prot6ines des 
groupes M et O et forte r6activit6 s^rologique vis-^-vis des proteines issues 
de la souche YBF30 selon T invention ou de la souche SIV CPZGAB; absence 
d 'amplification g^nomique ^ Faide des amorces des rdgions env et gag des 
VIH-1 des groupes M et O; amplification g6nomique en pr6sence des amorces issues de la souche YBF30, selon T invention; et homologie 
des produits du g6ne d'enveloppe supdrieure a 70 % vis-^-vis de la souche YBF30. 
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SOUCHES DE VIH-1 NON-M NON-O, FRAGMENTS ET APPLICATIONS 

La presente invention est relative a des souches de retrovirus du 
groupe VTH-l, non-M non-O, notamment une souche denommee YBF30, a ses frag- 
ments ainsi qu'a ses applications, en tant que reactif de diagnostic et en tant qu'agent 
5 immunogene. 

Les virus humains de rimmunodeficience acquise, VIH-1 et VIH-2 
sont des retrolentivirus, virus retrouves chez de nombreux primates africains. Tous ces 
virus semblent avoir un ancetre commun ; il est toutefois tres difficile de prejuger de la 
periode a laquelle ces difFerents virus se sont separes de ce precurseur. D'autres virus 
10 plus distants bien que faisant partie du meme groupe sont retrouves chez d'autres 
mammiferes (ongules et felins). 

Tous ces virus sont associes a des infections longues ; I'absence de 
symptomes est la regie chez les singes infectes naturellement. 

Du fait de sa forte homologie avec le virus du Sooty Mangabey 
15 (Afrique de I'Ouest), I'origine du VIH-2 semble claire, mais aucun virus proche du 
VTH-l n'a ete retrouve chez les singes. Les virus les plus proches sont des virus retrou- 
ves chez deux chimpanzes (SIV CPZGAB, SIV ANT). 

Une importante variabilite genetique est retrouvee chez tous les 
lentivirus, et I'etude phylogenetique de ces variants obtenus a partir de nombreux points 
20 geographiques differents a permis de distinguer pour VTH-l, 8 sous-types (clades), 
tous egalement equidistants entre eux. Les clades ne sont qu'une representation 
mathematique de I'expression de la variabilite : I'analyse phenetique, basee non sur les 
acides nucleiques mais sur les acides amines dorme des resultats differents (Korber et 
al, 1994). 

25 La mise en evidence de sous-types correspond a une analyse phylo- 

genetique qui n'a pas, a ce jour de correlation physiopathologique, mais une correspon- 
dance geographique. En effet, chaque sous-type est retrouve principalement dans un 
certain espace geographique. En Europe et aux Etats-Unis, le sous-type B est majori- 
taire, alors qu'en Thailande, deux sous-types E et B sont retrouves, et qu'il existe une 

30 correlation forte entre le mode de transmission qui, en fait, correspond a une certaine 
population et le sous-type retrouve. Tous les clades ont ete retrouves en Afrique et 
leurs distributions a travers le reste du monde reflete une probabilite de rencontre entre 
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personnes a comportement a haut risque. Le clade majoritaire, car present en propor- 
tion importante en Afrique est le clade A. Dans certains pays d'Afrique, une tres grande 
variabilite a ete retrouvee (G. Myers, 1994 ; P.M. Sharp et al., 1994). Plusieurs sous- 
types ont ete caracterises dans les pays d'Afrique centrale de I'ouest, comme la 
Republique Centre Africaine (Murphy et al, 1993) et le Cameroun (Nkengasong et al, 
1994). 

Demierement, des patients porteurs de virus variants du VIH-1, dont 
les serums posaient des problemes de detection pour certains kits commercialises sur le 
marche frangais et dont les western blots de confirmation etaient atypiques, ont ete 
caracterises (Loussert-Ajaka et al ; 1994; Simon et al, 1994 ; Demande Internationale 
PCT WO 96/27013). 

L'analyse de ces variants a permis de confirmer que les virus VTH de 
type 1, devaient etre sous-divises en deux groupes, le groupe M (majeur) et un groupe 
O (Outlier) incluant ces isolats, comme I'avaient propose Charneau et al, 1994. L'ana- 
lyse du rapport des mutations synonymes/mutations non synonymes sur les sequences 
des virus du groupe O connus, indique que ce nouveau groupe est aussi ancien, si ce 
n'est plus, que le groupe M (Loussert-Ajaka et al, 1995). Sa faible prevalence a ce jour, 
8% des patients infectes par VTH-l au Cameroun (Zekeng et al, 1994), et 18 cas carac- 
terises en France, serait due a des facteurs purement epidemiologiques. 

Ces deux groupes de VTH-l forment un arbre en forme de double 
etoile (figures 9 a 19). Deux isolats, SIV CPZGAB, caracterise a partir d'un chimpanze 
du Gabon (Huet et al, 1990) et CPZANT, caracterise a partir d'un chimpanze du zoo 
d'Anvers ont des sequences et des organisations geniques tres proche de VTH-l, mais 
ne s'inscrivent dans aucun de ces deux groupes et forment sur I'arbre phylogenetique 
deux nouvelles branches. 

La mise en evidence de nouveaux variants est importante pour mettre 
au point des reactifs de depistage des infections par VTH, suflfisamment sensibles et 
specifiques, c'est-a-dire ne conduisant pas a des resultats faussement negatifs ou faus- 
sement positifs et des compositions protectrices vis-a-vis de sous-types n'appartenant 
ni au groupe M, ni au groupe O. 

En consequence, la Demanderesse s'est donne pour but de pourvoir a 
une souche non-M, non-O, ainsi qu'a des sequences issues de cette souche, aptes a 
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permettre la detection de variants du VIH-1 non M et non-O, qui permettent d'eviter 
I'obtention de resultats faussement negatifs ou faussement positifs. Pour ce faire, les 
Inventeurs ont notamment etabli un algorithme de differenciation et de confirmation 
entre les infections HIV- 1 des groupes M et O, ce qui leur a permis de seiectionner des 
variants non-M, non-0. 

La presente invention a pour objet une souche de VIH-1 non-M non- 
O, presentant les caracteristiques morphologiques et immunologiques du retrovirus 
depose a la Collection Nationale de Cultures de Microorganismes tenue par I'lnstitut 
Pasteur sous le numero 1-1753 (denomme YBF30) le 2 juillet 1996. 

On entend par variant non-M non-O, un VIH de type 1, qui serologi- 
quement et moleculairement ne peut etre reconnu comme appartenant a Tun de ces 
groupes. 

La presente invention a egalement pour objet la sequence nucleoti- 
dique complete de la souche telle que definie ci-dessus (SEQ ED N°l) ainsi que des 
fragments d'acide nucleique d'au moins 10 nucleotides, issus de ladite souche. 

Parmi ces fragments, on peut citer : 

- LTR YBF 30 (SEQ ID N^2), 

- GAG YBF 30 (SEQ ID N°3) (gene gag), 

- POL YBF 30 (SEQ ID N°5) (gene pol), 

- VIF YBF 30 (SEQ ID N°7) (gene v//), 

- VPR YBF 30 (SEQ ID N^9) (gene vpr), 

- VPU YBF 30 (SEQ ED N°l 1) (gene vpu), 

- TAT YBF 30 (SEQ ID N°13) (gene tat), 

- REV YBF 30 (SEQ ID N^l 5) (gene rev), 

- ENV gpl60 YBF 30 (SEQ ED N^17) (gene env), 

- NEF YBF 30 (SEQ ED N^19) (gene nef), 

- les SEQ ED N^21-57, egalement denommees respectivement YLG, 
LPBS.l, GAG Y ASl.l, GAG Y ASl, GAG 6, GAG Y SI, GAG Y Sl.l, GAG Y 
S1.2, YRT ASl. 3, YRT AS1.2, YRT ASl.l, YRT 2, YRT ASl, YRT 2.1, YRT 2.2, 
YRT 2.3, YRT 2.4, 4481-1, 4481-2, 4235.1, 4235.2, 4235.3, 4235.4, SK69.6, 
SK69.5, SK69.4, SK69.3, SK69.2, SK69.1, SK68.1, SK68.2, SK68.3, LSI ASL3, LSI 
ASl. 2, LSI ASl.l, LSI A1,YLPA, ainsi que toute sequence, qui n'est pas identique a 
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I'une des sequences nucleotidiques ci-dessus ou n'est pas complementaire de I'une de 
ces sequences, mais est neanmoins susceptible de s'hybrider, de maniere specifique, 
avec une sequence nucleique issue d'un virus VIH-1 non-M, non-O. 

De telles sequences trouvent application dans T identification speci- 
5 fique d'un VTH-l non-M non-O, comme reactif de diagnostic, seules ou en pool avec 
d'autres reactifs, pour ['identification difFerentielle de n'importe quel VIH-1. 
Ces sequences peuvent notamment etre mises en oeuvre dans des tests de diagnostic 
comprenant, soit une hybridation directe avec la sequence virale a detecter, soit une 
amplification de ladite sequence virale, en utilisant comme amorces ou comme sondes, 

10 un oligonucleotide comprenant au moins 10 nucleotides, inclus dans Tune quelconque 
des sequences ci-dessus et notamment Tune des sequences SEQ ID N°21-57 precitees. 

La presente invention a egalement pour objet des VTH-l, caracterises 
en ce qu'ils sont distincts a la fois du groupe M et du groupe O et presentent les 
caracteristiques suivantes : 

15 * peu ou pas de reactivite serologique vis-a-vis des proteines des 

groupes M et O et forte reactivite serologique vis-a-vis des proteines issues de la 
souche YBF30 ou de la souche SIV CPZGAB ; 

* absence d' amplification genomique a I'aide des amorces des 
regions env et gag des VIH-1 des groupes M et O ; 

20 * amplification genomique en presence des amorces issues de la 

souche YBF30, telles que definies ci-dessus ; et 

* homologie des produits du gene d'enveloppe > 70 % vis-a-vis de la 

souche YBF30. 

L'invention a egalement pour objet I'utilisation des sequences 
25 decrites ci-dessus pour la mise en oeuvre d'un procede d' hybridation et/ou 
d' amplification genique de sequences nucleiques de type VTH-l, ces procedes etant 
applicables au diagnostic in vitro de I'infection potentielle d'un individu par un virus du 
type VIH-1 non-M non-O. 

Ce procede de diagnostic in vitro est realise a partir d'un echantillon 
30 biologique (serum ou lymphocyte circulant) et comprend : 

. une etape d'extraction de I'acide nucleique a detecter, appartenant 
au genome du virus, eventuellement present dans I'echantillon bioiogique et, le cas 
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echeant, une etape de traitement de I'acide nucleique, a I'aide d'une transcriptase inver- 
se, si ce dernier est sous forme d'ARN, 

. au moins un cycle comprenant les etapes de denaturation de Tacide 
nucleique, d' hybridation avec au moins une sequence conforme a T invention et even- 
5 tueilement, si necessaire, extension de I'hybride forme, en presence de reactifs conve- 
nables (agent de polymerisation, tel qu'ADN polymerase et dNTP) et 

. une etape de detection de la presence eventuelle de I'acide 
nucleique appartenant au genome d'un virus de type VTH-l de groupe non-M non-O. 

Les conditions mises en oeuvre pour la PGR a I'aide des amorces 
10 issues de la souche YBF30 sont les suivantes : 

- Extraction de I'ADN lymphocytaire par la technique phenol-chloro- 
fome et quantification par spectrophotometrie a une longueur d'onde de 260 nm. 
Toutes les amplifications sont realisees sur Perkin Elmer thermocycler 2400. 

- Les PGR longues (9 kb) sont realisees avec le kit XL PGR (Perkin 
15 Elmer) selon les conditions du fabriquant et avec les dNTP, les tampons foumis et le 

« hot start » de Perkin Elmer ; les cycles d' amplification de cette PGR longue sont : 

. 1 cycle de denaturation pendant 2 minutes a 94°G, 
. puis 16 cycles : 15 secondes a 94 "^G, 15 secondes a 55°G, 8 minutes 

a 68^G, 

20 . puis 24 cycles : 15 secondes a 94'^G, 15 secondes a 55°G, 8 minutes 

a GS'^C, en ajoutant a chaque cycle 15 secondes de plus (incrementation). 

- Les PGR nichees sont realisees sur les produits d' amplification des 
PGR longues. Les conditions de realisation des PGR nichees sont : 

. tampon et enzyme Taq polymerase « Expand High Fidelity PGR 
25 System » de Boehringer Mannheim selon les instructions du fabriquant, dNTP et « hot 
start » de Perkin Elmer, 

. 200 |i,M de chaque dNTP, 20 pmol de chaque amorce selon 
I'invention, 5 jLil d'ADN, 10 |al de tampon PGR lOX, 2,6 unites de Taq polymerase 
dans un volume de 100 |al, 
30 . amplification : un cycle de 2 minutes a 94°G, suivie de 38 cycles : 

15 secondes a 94°G, 15 secondes a 55''G, un temps d' elongation a 72°C variable selon 
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la taille du produit de PCR a amplifier (de 30 secondes a 2 minutes) et un dernier cycle 
d'elongation de 10 minutes a 

La detection du produit amplifie est realisee de preference par 
sequen^age direct. 

5 L'invention a egalement pour objet un peptide ou un fragment pepti- 

dique, caracterise en ce qu'il est susceptible d'etre exprime par une souche de VIH-1 
non-M non-0 ou a I'aide d'une sequence nucleotidique telle que defmie ci-dessus et en 
ce qu'il est apte : (1) a etre reconnu par des anticorps induits par un VIH-1 non-M 
non-O, tel que defini ci-dessus et notamment la souche YBF30 ou un variant de celle-ci 
10 et presents dans un echantillon biologique obtenu apres une infection par une souche de 
VIH-1 non-M non-0 et/ou (2) a induire la production d'anticorps anti-VTH-l non-M 
non-O. 

Parmi ces peptides, on peut citer, en particulier ceux issus de la 
souche YBF30 et notamment : celui exprime par le gene gag (SEQ ID N"^ 4), celui 

15 exprime par le gene pol (SEQ ID N"" 6), celui exprime par le gene v//(SEQ ID N"" 8), 
celui exprime par le gene vpr (SEQ ID N° 10), celui exprime par le gene vpii (SEQ ED 
N"* 12), celui exprime par le gene tat (SEQ ID N° 14), celui exprime par le gene rev 
(SEQ ID N° 16), celui exprime par le gene env (SEQ ID N° 18) ou Tun de ses frag- 
ments, tel qu'un fragment de la region de la boucle V3 

20 CTRPGNNTGGQVQIGPAMTFYNIEKIVGDIRQAYC (SEQ ID 58) et celui 
exprime par le gene nef (SEQ ID N° 20) ou un fragment de ceux-ci aptes a reconnaitre 
les anticorps produits lors d'une infection par un VTH-l non-M non-0 tel que defini ci- 
dessus. 

L'invention a egalement pour objet des compositions immunogenes 
25 comprenant un ou plusieurs produits de traduction des sequences nucleotidiques selon 
l'invention et/ou I'un des peptides tels que definis ci-dessus, obtenus notamment de 
maniere synthetique. 

L'invention a egalement pour objet les anticorps diriges contre I'un 
ou plusieurs des peptides decrits ci-dessus et leur utilisation pour la mise en oeuvre de 
30 methodes de diagnostic in vitro, notamment diflferentielle, de I'infection d'un individu 
par un virus de type VIH-1, selon les precedes connus de I'homme du metier. 
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La presente invention englobe Tensemble des peptides aptes a etre 
reconnus par des anticorps isoles a partir d'un serum infectieux obtenu apres une 
infection par une souche VIH- 1 non-M non-O et les peptides aptes a etre reconnus par 
un anticorps selon 1' invention. 
5 L' invention a, en outre, pour objet une methode de diagnostic in 

vitro d'un VIH-1 non-M non-O, caracterisee en ce qu'elle comprend la mise en contact 
d'un echantillon biologique preleve chez un patient, avec des anticorps selon la reven- 
dication 10, eventuellement associes a des anticorps anti-SIV CPZGAB et la detection 
des complexes immunologiques formes entre les antigenes de VIH-1, eventuellement 
10 presents dans I'echantillon biologique et lesdits anticorps. 

L'invention a egalement pour objet une trousse de diagnostic de 
VTH-1, caracterisee en ce qu'elle inclut au moins un reactif selon l'invention. 

Outre les dispositions qui precedent, l'invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a des 
exemples de mise en oeuvre du procede objet de la presente invention ainsi qu'aux 
dessins annexes, dans lesquels : 

- les figures 1 a 7 illustrent T emplacement des diflferentes amorces sur 
le genome de la souche YBF30 ; 

- la figure 8 illustre 1' organisation genomique de la souche YBF30 ; 

- les figures 9 a 16 represented T analyse phylogenetique des difife- 
rents genes de la souche YBF30 par rapport au VIH-1 de groupe M et de groupe O 
(figure 9 : gene lti\ figure 10 : gene gag, figure 11 : gene tat, figure 12 ; gene rev, 
figure 13 : gene v//, figure 14 : gene env gpl20, figure 15 : gene env gp41, figure 16 : 
gene nef, figure 1 7 : gene pol, figure 1 8 : gene vpr, figure 1 9 : gene vpn) ; 

- la figure 20 illustre le pourcentage de distance genetique entre 
YBF30 et VIH-l/SIV CPZGAB. 

II doit etre bien entendu, toutefois, que ces exemples sont donnes 
uniquement a titre d' illustration de T objet de l'invention, dont ils ne constituent en 
aucune maniere une limitation. 
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EXEMPLE : Obtention d'un variant VIH-1 non-M non-O selon I'invention 
(YBF30) et ses applications. 

Ceci a en particulier ete possible en etudiant Tepidemiologie de I'in- 
fection par les virus de rimmunodeficience humaine acquise (VIH) au Cameroun, qui 
5 est particulierement paradoxale. Dans ce pays, la diversite des souches est remarquable, 
puisque la plupart des sous-types connus a ce jour des virus VIH-1 du groupe M 
(Majeur) ont ete rapportes. Des cas d'infections par des virus VTH-l hautement diver- 
geants du groupe O (O pour outlier) ont ete rapportes, presque exclusivement chez des 
patients d'origine camerounaise. Des cas d'infections par VIH-2, HTLV-1 et HTLV-2 
10 sous-type A et B ont ete egalement rapportes. 

Sur la base des resultats des evaluations serologiques et genotypiques 
anterieures, les Invent eurs ont etabli un algorithme de differenciation et de confirmation 
entre les infections VIH-1 des groupes M et O, afin de selectionner des variants non- 
M, non-O. 

15 Ces methodes ont ete appliquees sur des echantillons adresses au 

Laboratoire National de Reference des infections a VIH de Yaounde et ont permis de 
caracteriser un isolat VIH hautement divergeant et de definir les outils de caracterisa- 
tion d'un nouveau groupe VTH-l, compte tenu des homologies observees entre cette 
souche humaine YBF30 et la souche simienne SIV CPZGAB. 

20 I - Moyen de caracterisation serologigue du variant YBF30 lors de I'etude epidemio- 

1) Recueil des echantillons : 

Tous les serums de patients adultes adresses au Laboratoire de refe- 
rence de Yaounde en 1994 et 1995 pour depistage ou confirmation d'une infection HIV 
25 ont ete etudies (n=8831). 

2) Differenciation serologigue entre VTH-l groupe M et groupe O et 
selection des variants : 

En cas de positivite du depistage anti-VTH (EIA indirect mixte HIV- 
1 et HIV-2 Genelavia Mixt, Sanofi-Pasteur, Paris, France), un test EIA base sur le 
30 principe de la competition vis a vis d'antigene specifique du groupe M (Wellcozyme 
Rec HIV-1, Murex, Dartford, UK), a ete associe. 
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En cas de positivite du test de type competitif Wellcozyme Rec HIV- 
1, avec ratio de reactivite en densite optique (DO) par rapport a la valeur seuil ou cut- 
off {CO) superieur a 5 (CO/DO >5), le serum est considere comme VIH-1 positif, 
resultat qui doit etre confirme sur un nouveau prelevement. 
5 Le choix d'un ratio de reactivite superieur a 5 pour considerer le test 

par competition comme test de confirmation de I'infection a VIH- 1 est base sur I'expe- 
rience acquise par le laboratoire de virologie de Thopital Bichat : sur 7200 echantillons 
reactifs avec un ratio > 5, tous presentaient un Western Blot VIH-1 (WB, New Lav 
Blot 1, SDP, Mames la Coquette) fortement positif. En dehors des cas de sero- 

10 conversions VIH-1, les echantillons confirmes VIH positifs et presentant un ratio 
Wellcozyme < 5, correspondent soit a des infections par VIH-2, soit a des infections 
par VIH-I du groupe O ou d'autres variants. 

Pour eliminer les reactions faussement positives en depistage EIA 
mixte, les echantillons presentant un ratio CO/DO < 5 sont systematiquement testes par 

15 un EIA mixte HIV-l/HIV-2 de troisieme generation (Enzygnost Plus, Marburg, 
Germany) incluant les antigenes des VTH-l des groupes M et O (recombinant gp41 de 
la souche MVP5180). En cas de positivite de ce test, un test rapide discriminant HIV-1 
et HIV-2 (Multispot, SDP, Marnes la Coquette) et un Western Blot (WB, New Lav 
Blot 1 ou 2, SDP) sont realises. 

20 3) Confirmation serologique des infections VTH-l groupe O et 

variants. 

Tous les echantillons presentant un ratio CO/DO < 5, diflFerencies 
positifs par WB (criteres de positivite : 2 ENV +/- POL +/- GAG ou 1 ENV + POL +/- 
GAG) et HIV-1, sont testes par un test DoUblot utilisant des antigenes peptidiques des 
25 regions V3 et transmembranaires (InnoLia, Innogenetics, Ghent, Belgium). 

4) Isolement retroviral des souches de groupe O et des variants. 
Les cellules mononucleees sanguines peripheriques (PBMC) des 
patients seropositifs ont ete isoles par gradient de Ficoll-Hypaque au Cameroun, 
conservees et transportees a Paris en azote liquide. 
30 Apres decongelation, les PBMC des patients ont ete cocultives avec 

des lymphocytes de donneurs caucasiens seronegatifs. La replication virale dans les 
sumageants de cultures a ete mise en evidence par la detection de Tactivite transcrip- 
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tase inverse et par la recherche de I'Antigene p24 (Elavia p24 polyclonal, SDP) sur une 
periode d'un mois. 

5) Sequences : 

Les produits des PCR sont visualises sur gels d'agarose de 1 a 1,4 % 
selon la taille des fragments, precipites en acetate de sodium 3M (1:10) et 3 volumes 
d'ethanol absolu, incubes 30 minutes a -SO'^C, centrifuges 20 minutes a 13 000 rpm. Le 
culot est seche puis repris avec 10 |al d'eau distillee (Sigma), La purification est realisee 
sur « Qiaquick Gel Extraction kit » (Qiagen) selon les instructions du fabriquant ; les 
produits sont sequences avec le Kit Dye Terminator Applied Biosystem sur un auto- 
mate DNA Sequencer (Applied Biosystems, Inc., Foster Cit, CA), comme decrit 
precedemment (Loussert-Ajaka et al, 1995) ; les sequences nucleotidiques sont analy- 
sees sur logiciel Sequence Navigator (Applied Biosystems), alignes avec le logiciel 
GeneWorks (Intelligenetics Inc.). 

6) Analyses phylogenetiques : 

Les sequences ont ete alignees avec le logiciel CLUSTAL pour les 
alignements multiples, en prenant comme matrice de reference, les alignements de la 
compilation des sequences VTH du laboratoire de Biologic et de Biophysique 
Theorique de Los Alamos, New Mexico, 87545 USA. 

Les analyses phylogenetiques ont ete faites avec le logiciel PHYLIP ; 
dans un premier temps, les distances ont ete calculees avec DNADIST, puis I'analyse 
phylogenetique a ensuite ete realisee avec NEIGHBOR JOINING ou FITCH ; enfin, 
les arbres ont ete dessines avec DRAWTREE (figures 9 a 19). Les pourcentages de 
distance genetique sont egalement illustres a la figure 20. 

Pour les analyses de « boostrapping », SEQBOOT a d'abord ete uti- 
lise, suivi de DNADIST et NEIGHBOR-JOINING ou FITCH. Enfin les valeurs de 
boostrap ont ete obtenues avec CONSENS. 

II - Resultats de I'enquete de mise en evidence des VTH groupe O et variant : 

174 echantillons, parmi 3193 echantillons positifs au depistage, ont 
ete consideres soit groupe O, soit groupe M avec reactivite serologique anormale, soit 
comme variants. 
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III - Mis^^eiLje.yLd_enc.e_d 'un dchanti non groiipe Q et non groupe M pres^£ntant_une 
rea ctivlte_s^erolo gique_a aQnna le 

Les 174 semms HIV-1 positifs par WB (Western Blot), mais reactifs 
avec un ratio CO/DO < 5 en EIA de type competitif ont ete testes par dot blot LIA de 
5 difFerenciation sur les peptides V3 du groupe M, groupe O et SIV CPZGAB : 

- 7 ne reagissent sur aucun des peptides (M, O ou SIV CPGGAB) 
representes. L'absence de coUecte cellulaire ne permet aucune conclusion. 

- 82 presentent une reactivite vis a vis d'au moins un des peptides 
correspondant a la boucle V3 des souches du groupe O. La frequence des reactions 

10 croisees est faible et limitee aux epitopes correspondant aux regions V3 consensus 
(1 1 %) et SIV-CPZ GAB (43 %) . 

- 84 serums sont non reactifs vis-a-vis des epitopes du groupe O. Ces 
prelevements ont ete realises majoritairement chez des patients presentant un SIDA 
(75/84). 

15 - un serum, preleve chez une patiente camerounaise (NJ) est reactif 

exclusivement avec le peptide SIV CPZGAB. Cette reactivite isolee vis a vis d'un anti- 
gene du SIV CPZGAB n'a jamais ete decrite auparavant. Des lymphocytes ayant ete 
collectes chez la patiente, la caracterisation virologique de cette souche nommee 
YBF30 a pu etre poursuivie. 

20 IV - Resultats, des exa mens, serolog iques et virolngiques sur les premiers prelevements 
efFectues sur cette patiente (mm 1 995^ f M" serum : 95-6295) : 

1) Tests ELISA commerciaux (Densite optique/valeur seuil) 
Critere de positivite : DO/CO > 1 

Genelavia = >15 
25 Wellcozyme CO/DO = 1,55 

Abbott Plus = >15 
Behring Plus= 4,2 

2) Western blot 

WB New Lav 1 Pasteur : 
30 160-H-, 120++ 68++, 5 5+ 41+ 40+/-, 34++, 24++, 18+ 
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3) LIA dot-Blot Innogenetics 

Negatif pour toutes les bandes groupe O et groupe M sauf V3 SIV 

CPZGAB 

4) Resultats des examens serologiques de recherche sur peptides 
5 specifiques des groupes M et O 

* La technique du Pr. Francis Barin du Laboratoire de Virologie du 
CHU de Tours a ete adaptee (Barin F. et al, 1996) ; des peptides des regions trans- 
membranaires synthetises (BioMerieux) on ete utilises, pour mettre au point un test de 
differenciation entre les groupes M et O. Cette technique est basee sur la competition 
de liaison des anticorps entre les peptides transmembranaires gp41 des groupes O et M 
deposes sur la phase solide et des peptides transmembranaires gp41 soit du groupe O, 
soit du groupe M en concentration superieure en une phase liquide de reaction 
hyperosmolaire. Les resultats sont illustres au Tableau I ci-apres, dans lequel le puits 
CP correspond au temoin d'inhibition 100 % et le puits CSP correspond au controle 0 
% d'inhibition. 

Tableau I 



Resultats des differenciations inter groupe O - groupe M du serum 6295 





gp41 M 


gp41 O 


CP 


CSP 


6295 


0,25 


0,36 


0,12 


1,98 



Ces resultats montrent qu'il existe une forte liaison vis-a-vis des pep- 
tides de la phase solide (CSP), une nette inhibition par I'adjonction combinee des pep- 
tides M et O (CP) mais pas de nette differenciation, soit par le peptide M, soit par le 
peptide O. II existe done une evidence serologique que la souche infectante n'appartient 
ni au groupe M, ni au groupe O. 

* Compte tenu d'une reactivite isolee sur le dot blot InnoLia vis-a-vis 
des antigenes V3 SIV CPZGAB, sur les memes bases de competition entre peptides, ce 
serum a ete etudie en mettant en competition les peptides gp41 M, gp41 O et gp 41 
SIV CPZGAB. 

L'utilisation du serum du chimpanze denomme 'Amandine* (donne par 
M. Peeters, qui a isole la souche SIV CPZGAB, AIDS 1992) a permis, dans un pre- 
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mier temps, de valider cette technique. Sur le tableau II, les valeurs (DO) les plus 
basses indiquent le plus haut degre de liaison aux antigenes. 

Tableau 11 

Resultats des difTerenciations inter groupe O - groupe M - SIVcpzGab avec le 
serum du chimpanze Amandine et le serum 6295 





gp41 M 


gp41 O 


gp41 
CPZGAB 


CP 


CSP 


Amandine 


0,8 


1,4 


0,3 


0,5 


1,9 


6295 


0,7 


1,1 


0,7 


0,4 


2,1 



La reactivite du serum « Amandine » confirme et valide le test selon 
r invention et indique que le serum de la patiente reagit de maniere identique vis-a-vis 
des peptides M et SIV CPZGAB, mais est sans reaction croisee avec le peptide O. 
10 Ces resultats montrent qu'il existe une inhibition similaire avec le 

serum de la patiente par les peptides gp41 du groupe M et gp41 SIV CPZGAB. Les 
antigenes de la souche infectante ont done donne naissance a des anticorps reconnais- 
sant, de fa?on similaire, les gp 41 du groupe M et du SIV CPZGAB. 

4) Resultats obtenus a partir de Tisolement lymphocytaire 
15 (prelevement mai 1995) 

Un retrovirus a ete isole a partir des lymphocytes preleves le 22 mai 
1995, selon les techniques classiques. La culture avec la lignee MT2 montre que la 
souche YBF30 ne forme pas de syncytia (NSI). 

V - Resultats des examens serologiques sur le deuxieme prelevement (Novembre 1995) 
20 (N° serum : 95-3371) 

1) LIA dot-Blot Innogenetics 

Negatif pour toutes les bandes, sauf V3 SIV CPZGAB 

2) Resultats des examens serologiques de recherche sur peptides 
specifiques des groupes M et O. 

25 Le Tableau III iliustre les resultats des differenciations gp41 inter 

groupe O - groupe M - SIV CPZGAB avec le serum 3371. 
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Tableau III 



Resultats des differenciations gp41 inter groupe O - groupe M - 
SrV CPZGAB avec le serum 3371 





gp41 M 


gp41 O 


gp41 cpz-gab 


CP 


CSP 


3371 


1,31 


1,7 


0,89 


0,54 


2,02 



5 Ces resultats confirment sur ce nouveau prelevement (efFectue chez 

la meme patiente, en phase terminale de la maladie) qu'il existe una inhibition marquee 
avec le serum de la patiente par le peptide gp41 SIV CPZGAB. 

Les antigenes de la souche infectante ont done induit des anticorps 
reconnaissant de fagon preferentielle la gp 41 du SIV CPZGAB. 
10 3) Resultats de Fisolement lymphocytaire (prelevement novembre 95 

(95-3371-YBF31)) 

Un retrovirus a ete isole a partir des lymphocytes preleves en novem- 
bre 1995, selon les techniques classiques et denomme YBF31 ; les elements de 
sequence sont identiques a ceux de YBF30. 
15 VI - Amplification genomique et Sequences de YBF 30 

L'ADN pour toutes les manipulations de PCR est extrait a partir des 
cellules de fin de culture positive. 

Les PCR realisees avec les amorces VIH- 1 groupe O dans difFerentes 
regions testees sont negatives (gcig, pol, env) . De meme, celles realisees avec les 
20 amorces specifiques du VDH-l groupe M sont negatives. 

Les conditions d' amplification et d'hybridation pour les PCR du 
groupe O sont reahsees dans les conditions decrites dans Loussert-Ajaka, 1995. Les 
conditions d' amplification et d'hybridation pour les PCR du groupe M sont celles 
decrites par les Auteurs cites ci-apres. 
25 Ces amorces groupe M sont positionnees selon la sequence HIV-1- 

HXB2 : 

- Dans Venv gpl20 : ED3/ED12 (position 5956-5985 ; 7822-7792) ; 
ED5/ED14 (6556-6581 ; 7960-7931) ; ED5/ED12 ; ED3/ED14 ; ES7/ES8 (7001- 
7020 ; 7667-7647) (Delwart et al. Science 1993; 262 : 1257-1261 ). 
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- Dans Venv gp41: premiere PCR ED3/M29, suivie d'une PCR nichee 
M28/M29 (7785-7808 ; 8099-8124) ; M28/M29 presentent les sequences suivantes: 
M28 : CGGTTCTT(AG)GGAGCAGC(ACT)GGAAGCA, 

M29 : T(CT)T(ACGT)TCCCA(CT)T(AT)(CT)A(AGT)CCA(AGT)GTCAT ; 
5 SK68/SK69 (Ou et aL Science, 1988; 239: 295-297). 

- Dans le gag : Amplicoi Roche Diagnostics systems ; amorces gag 
nichees (Loussert-Ajaka et al. Lancet 1995; 346: 912-913) ; SK38/SK39 (Ou et aL, 
Science, 1988; 239: 295-297). 

- Dans le pol : A/NEl (Boucher et al, Lancet, 1990; 336: 585-590) ; 
10 Pol3/Pol4 (Laure et aL, Lancet, 1988, ii, 538-541 ). 

Seules les PCR realisees avec les amorces H Pol sont positives 
(4235/4538) suivie d'une PCR nichee avec les amorces 4327/4481 (Fransen et al. 
Molecular and Cellular Probes 1994; 8: 31 7-322). Ce fragment H Pol, localise dans 
rintegrase (260 pb), a ete sequence. L' amplification avec les amorces HPOL est rendue 

15 possible, en raison de I'exces de virus. En effet, 1' AL)N utilise est extrait des cellules de 
fin de culture fortement positive (transcriptase inverses > 100.000 cpm). L' amplification 
de I'ADN extrait des cellules fraiches sans coculture est impossible de par le nombre 
important de mesappariement entre les amorces HPOL (surtout dans la region 3') et la 
sequence de I'isolat YBF30. La conservation de cette extremite 3' est tres importante 

20 pour Factivite d'extension de la Taq polymerase. 

1 - Sequence du gene pol : I'utilisation d' amorces tres degenerees 
pour Tamplification par RT-PCR du RNA extrait du sumageant de culture positif, a 
donne une amplification positive. Ce sont des amorces communes a tous les retrovirus 
(Donehower et al. J. Virol. Methods 1990; 28: 33-46), situes dans la region de la 

25 transcriptase inverse du gene pol. L'analyse du fragment apres sequence a permis de 
generer une amorce specifique YRT2 (SEQ ID N° 32) de I'isolat YBF30 et d'amplifier 
le gene pol en utilisant I'amorce Hpol 4481 (Fransen et aL, 1994 precite), comme 
amorce anti-sens. La sequence du fragment a ete realisee en synthetisant au far et a 
mesure des amorces specifiques pour chaque fragment genere (Figure 1). 

30 2 - Sequence du gene env : la deuxieme approche a ete de faire une 

PCR longue (XL-PCR, Perkin Elmer) amplifiant tout le virus (9000 pb) en utilisant des 
amorces situees dans le LTR : LPBS 1 (SEQ ED N''22) ; LSiGi, suivie d'une PCR 
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nichee avec YRT2 (SEQ ID 32)/SK69 de 6000 pb, et de sequencer toute I'enve- 
loppe en suivant la meme procedure. La sequence de la region gp41 a ete realisee en 
utilisant une PGR nichee avec les amorces SK68/LSiGi. 

3 - Sequence du gene gag : utilisation d'une PGR nichee, realisee par 
5 PGR longue (LPBS 1 /LSiGi), avec les amorces Gag 5 et Gag Hi, et en generant au 
fiir et a mesure des amorces specifiques, afm de marcher sur le genome viral. 

VII - Resultats des sequences 

La souche YBF30 a ete completement sequencee (voir Uste des 
sequences). La souche YBF31 de Novembre 1995 a ete partiellement sequencee et 
10 I'absence de variation significative confirme la validite des sequences de YBF30. 

VIII - Synthese de peptides de laxegion de la houcle V3 de la sauc he YBF30. 

L'etude des sequences de la region de la boucle V3 a permis de syn- 
thetiser le peptide correspondant et de comparer les acides amines de cette region de la 
souche YBF 30 avec ceux des autres sous-types M et des souches O. 
15 Les sequences des peptides sont : 

YBF30 : SEQ N° ID 58 

SIV GPZGAB : GHRPGNNTRGEVQIGPGMTFYNIENVYGDTRSAYG 

(SEQ ID N° 59) 

GROUPE O : GIRPGNRTYRNLQIGPGMTFYNVEIATGDIRKAFG 
20 (ANT70) (SEQ ID 60) 

GROUPE M : GTRPNNNTRKSVRIGPGQAFYATGDIIGDIRQAHG 
(SS-TYPE A) (SEQ ED N° 61) 

Le peptide a ete synthetise, a partir des 2 asparagines de la region 5' 
25 de la boucle et utilise selon le meme principe que decrit precedemment (voir IV 4)), a 
savoir en competition par rapport aux peptides du groupe M, du groupe O et du SIV 
GPZGAB. Les resultats illustres au Tableau IV confirment Toriginalite de cette souche 
et I'extension possible de ces souches puisque les resultats serologiques sont en faveur 
d'infection du type YBF30 au Gameroun. En outre, l'etude de 200 serums selectionnes 
30 VTH-l positifs du Gameroun met en evidence un nouveau cas presentant un profit 
similaire a celui de YBF30. 
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Tableau IV 
Etude de reactivite de 200 serums 



Serum 


Origine 


V3A 


V3cpz 


V3YBF30 


CP 


CSP 


953371 


Cameroun 


1,66 


0,38 


1,39 


0,39 


1,64 


956295. 


Cameroun 


1,72 


0,37 


1,16 


0,51 


1,73 


967321 


Cameroun 


0,07 


0,17 


0,5 


0,05 


0,27 


Amandine 


SIVGAB 


1,74 


0,14 


1,48 


0,19 


1,74 


NO A.* 


SIVANT 


2,66 


0,31 


1,88 


0,46 


1,9 



* serum du SIV CPZ ANT 



5 Sur ce nouveau test, la reactivite des serums 953371 et 956295, 

correspondant a la patiente chez qui la souche YBF30 a ete isolee, avec le peptide 
SIV-CPZ, a ete confirmee. La plus faible reactivite vis a vis de son propre antigene V3 
est classique lors des stades tardifs de la maladie. Cette reactivite reste cependant supe- 
rieure a celie relevee vis a vis du peptide M. Un autre patient camerounais (serum 
10 967321) presente le meme profil de reactivite peptidique. 
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Ainsi que cela ressort de ce qui precede, 1' invention ne se limite 
nullement a ceux de ses modes de mise en oeuvre, de realisation et d' application qui 
viennent d'etre decrits de fagon plus explicite ; elle en embrasse au contraire toutes les 
30 variantes qui peuvent venir a T esprit du technicien en la matiere, sans s'ecarter du 
cadre, ni de la portee, de la presente invention. 



wo 98/26075 



PCT/FR97/02227 



19 



LISTE DE SEQUENCES 



(1) INFORMATIONS GENE RALES : 

( i ) DEPOSANT : 

(A) NOM: INSTITUT NATIONAL DE LA SANTE ET DE LA 

RECHERCHE MEDICALE - INSERM 

(B) RUE: 101 rue de Tolbiac 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75654 CEDEX 13 

(A) NOM: ASSISTANCE PUBLIQUE-HOPITAUX DE PARIS 

(B) RUE: 3 avenue Victoria 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75100 RP 

(A) NOM: INSTITUT PASTEUR 

(B) RUE: 2 8 rue du Docteur Roux 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75724 Cedex 15 

(A) NOM: MAUCLERE Philippe 

(B) RUE: 2 rue Buhan 

(C) VILLE: BORDEAUX 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 33000 

(A) NOM: LOUSSERT-AJAKA Ibtissam 

(B) RUE: 2 6 avenue de la Republique 

(C) VILLE: SARTROUVILLE 
{ E ) PAYS : FRANCE 

(F) CODE POSTAL: 78500 

(A) NOM: SIMON FranQOis 

(B) RUE: 8 rue Germain Pi Ion 

(C) VILLE: PARIS 
{ E ) PAYS : FRANCE 

(F) CODE POSTAL: 75018 

(A) NOM: SARAGOSTI Sentob 

(B) RUE: 69 bis rue de Billancourt 

(C) VILLE: BOULOGNE BILLANCOURT 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 92100 

(A) NOM: BARRE-SINOUSSI Frangoise 

(B) RUE: 104 Le Capricome , 5 0 rue d ' Erevan 

(C) VILLE: ISSY LES MOULINEAUX 

( E ) PAYS : FRANCE 

(F) CODE POSTAL: 9213 0 



(ii) TITRE DE L' INVENTION: SOUCHES DE VIH-1 NON-M NON-0, FRAGMENTS ET 

APPLICATIONS . 



(iii) NOMBRE DE SEQUENCES: 61 
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(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS /MS -DOS 

(D) LOGICIEL: Patentin Release #1.0, Version #1.30 (OEB) 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 9183 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID 


NO: 1 : 






CTTCTCGCTT 


GTACTGGGTC 


TCTCTTGCTG 


/~1 TV /~1 TV TV mm TV 

G AC C AG ATT A 


GAGCCTGGGA 


GCTCTCTGGC 


60 


TAGCAGGGAA 


CCCACTGCTT 


AAGC CTC AAT 


AAAGCTTGCC 


TTGAGTGCTA 


AAGTGGTGTG 


120 


TGCCCATCCA 


TTCGGTAACT 


CTGGTACCTA 


GAGATCCCTC 


AGACCATCTA 


GACTGAGTGA 


180 


AAAATCTCTA 


GCAGTGGCGC 


CCGAACAGGG 


TV r^mrT^/^ TV TV TV TV 

ACTTGAAAAC 


GAA?^GTAGAA 


CCGGAGGCTG 


240 


AATCTCTCGA 


CGCAGGACTC 


GGCTCGTTGG 


f^^/^ TV TV TV 

TGCACACAGC 


GAGAGGCGAG 


GCGGCGGAAG 


300 


TGTGAGTACG 


CAATTTTGAC 


TGGCGGTGGC 


TV TV TV TV /*tm TV 

CAGAAAGTAG 


GAGAGAGGAT 


GGGTGCGAGA 


360 


GCGTCAGTGT 


TAACAGGGGG 


AAAAT TAG AT 


/"i TV TV rn/~'/^ ^ TV TV m 

C AAT GGG AAT 


CAATTTATTT 


GAGACCAGGG 


420 




AATACAGAAT 


G AAAC AT T T A 


/"I m "A m /"I TV TV 

GTATGGGCAA 


GCAGGGAGCT 


GGAAAGATTC 


480 


GCTTGTAACC 


CAGGTCTCAT 


GG AC AC AG C G 


GACGGCTGTG 


CCAAGTTACT 


AAATCAATTA 


540 


GAACCAGCTC 


TCAAGACAGG 


G TC AGAAG AA 


CTGCGCTCTT 


TATATAACGC 


TCTAGCAGTT 


600 


CTTTATTGTG 


TCCATAGTAG 


GATACAGATA 


CACAACACAC 


AGGAAGCTTT 


GGACAAGATA 


660 


AAAGAGAAAC 


AGGAACAGCA 


CAAGCCCGAG 


CCAAAAAACC 


CAGAAGCAGG 


GGCAGCGGCA 


720 


GCAACTGATA 


GCAATATCAG 


TAGGAATTAT 


CCTCTAGTCC 


AGACTGCTCA 


AGGACAAATG 


780 


GTACATCAGC 


CGCTGACACC 


CAGAACCTTA 


AATGCTTGGG 


TGAAAGTGAT 


AGAGGAGAAG 


840 


GCCTTTAGTC 


CAGAAGTAAT 


ACCAATGTTT 


ATGGCCTTGT 


CAGAAGGGGC 


AACGCCCTCA 


900 


GATCTAAATA 


CTATGTTAAA 


TACAGTAGGG 


GGACATCAGG 


CAGCAATGCA 


GATGCTGAAG 


960 


GAAGTCATCA 


ATGAGGAAGC 


AGCAGACTGG 


GATAGGACAC 


ATCCAGTCCC 


TGTGGGACCA 


1020 


CTACCCCCAG 


GGCAACTGAG 


AGACCCTAGA 


GGAAGTGATA 


TAGCAGGAAC 


AACTAGCACC 


1080 


CTGGCAGAAC 


AGGTGGCTTG 


GATGACTGCT 


AATCCTCCTG 


TTCCAGTAGG 


AGATATTTAT 


1140 


AGAAGATGGA 


TAGTCCTGGG 


GTTAAACAGA 


ATTGTGAGAA 


TGTATAGTCC 


TGTCAGCATT 


1200 


CTAGAGATCA 


AACAAGGACC 


AAAAGAACCC 


TTCAGAGACT 


ATGTAGACAG 


GTTCTACAAA 


1260 


ACTCTAAGAG 


CAGAGCAGGC 


AACACAGGAA 


GTAAAGAATT 


GGATGACAGA 


AACACTCTTA 


1320 


GTACAAAATG 


CAAACCCAGA 


TTGTAAACAG 


CTCCTAAAAG 


CATTAGGGCC 


AGGAGCTACC 


1380 


TTAGAAGAGA 


TGATGACGGC 


CTGCCAGGGA 


GTGGGGGGAC 


CAGCACATAA 


GGCAAGAGTG 


1440 
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CTAGCAGAGG CTATGTCACA GGTGCAGCAG CCAACAACTA GTGTCTTTGC ACAAAGGGGA 15 00 
AACTTTAAAG GCATAAGGAA ACCCATTAAA TGTTTCAATT GTGGCAAAGA GGGCCATTTG 15 60 
GCAAGAAACT GTAAGGCCCC TAGAAGAGGA GGCTGTTGGA AGTGTGGGCA AGAAGGACAT 1620 
CAAATGAAAG ATTGTAAAAA TGAAGGAAGA CAGGCTAATT TTTTAGGGAA GAGCTGGTCT 1680 
CCCTTCAAAG GGAGACCAGG AAACTTCCCC CAGACAACAA CAAGGAAAGA GCCCACAGCC 1740 
CCGCCACTAG AGAGTTATGG GTTTCAGGAG GAGAAGAGCA CACAGGGGAA GGAGATGCAG 18 00 
GAGAACCAGG AGAGGACAGA GAACTCTCTG TACCCACCTT TAACTTCCCT CAGATCACTC 18 60 
TTTGGCAACG ACCCGTCATC ACAGTAAAAA TAGGGAAAGA AGTAAGAGAA GCTCTTTTAG 192 0 
ATACAGGAGC TGATGATACA GTAATAGAAG AGCTACAATT AGAGGGAAAA TGGAAACCAA 1980 
AAATGATAGG AGGAATTGGA GGATTTATCA AAGTGAGACA ATATGATAAT ATAACAGTAG 2 0 40 
ACATACAGGG AAGAAAAGCA GTTGGTACAG TATTAGTAGG ACCAACACCT GTTAATATTA 2100 
TAGGAAGAAA TCTTTTAACC CAGATTGGCT GTACTTTAAA TTTTCCAATA AGTCCTATTG 2160 
AAACTGTACC AGTAAAATTA AAACCAGGAA TGGATGGCCC AAAGGTAAAA CAATGGCCTT 22 2 0 
TGACAACAGA AAAAATAGAG GCATTAAGAG AAATTTGTAC AGAAATGGAA AAGGAAGGAA 22 8 0 
AAATTTCTAG AATAGGGCCT GAGAATCCAT ATAACACTCC AATTTTTGCT ATAAAAAAGA 23 40 
AAGATAGCAC TAAATGGAGA AAATTAGTAG ATTTCAGGGA ATTAAATAAA AGGACCCAAG 2400 
ATTTTTGGGA AGTGCAGCTA GGT^lATTCCAC ATCCAGCAGG ATTAAAGCAG AAAAAATCAG 2 46 0 
TGACAGTTTT GGATGTAGGA GATGCTTATT TTTCATGTCC CTTGGACAAA GATTTTAGAA 252 0 
AGTATACAGC TTTTACCATA CCTAGTATAA ACAATGAGAC ACCTGGTATT AGATACCAGT 25 80 
ATAATGTGCT GCCACAAGGC TGGAAAGGGT CACCAGCAAT TTTTCAGAGT ACAATGACAA 2 640 
AAATTCTAGA ACCATTCAGA GAGAAACATC CAGAGATAAT CATTTACCAG TACATGGATG 2 70 0 
ACCTCTATGT GGGATCTGAC TTAGAACTAG CACAACATAG AGAGGCAGTA GAAGACCTTA 27 60 
GAGATCATCT TTTGAAGTGG GGCTTTACGA CCCCTGACAA AAAACATCAG AAGGAACCCC 2 82 0 
CGTTCCTCTG GATGGGATAT GAACTCCATC CAGACAAATG GACAGTCCAG CCAATAAAGT 2 8 80 
TACCAGAAAA GGATGTATGG ACTGTCAATG ATATACAGAA ATTAGTAGGA AAGTTAAATT 2 9 40 
GGGCAAGTCA GATCTATCCA GGAATCAGAG TAAAACAGCT CTGTAAATTA ATCAGAGGAA 3 000 
CCAAAGCTTT GACAGAAGTA GTCAACTTTA CAGAAGAAGC AGAATTAGAA CTAGCAGAAA 3 0 60 
ACAGGGAGAT ATTAAAAGAA CCCCTGCATG GAGTCTATTA TGACCCAGGA AAAGAATTAG 312 0 
TAGCAGAAAT TCAAAAGCAA GGACAAGGTC AGTGGACATA TCAGATTTAT CAGGAGTTAC 3180 
ATAAAAATTT AAAAACAGGA AAGTATGCAA AAATGAGATC TGCCCATACT AATGATATAA 32 40 
AACAGTTAGT TGAAGTGGTA AGGAAAGTGG CAACAGAAAG TATAGTAATT TGGGGAAAGA 3 3 00 
CTCCTAAATT TAGATTACCA GTACAAAAGG AAGTGTGGGA GGCATGGTGG ACCGATCATT 33 60 
GGCAAGCAAC TTGGATTCCT GAGTGGGAAT TTGTCAACAC TCCTCCCCTT GTAAAATTAT 342 0 
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GGTATCAGTT AGAAACAGAG CCAATCAGTG GGGCAGAAAC TTTCTATGTA GATGGAGCAG 3 4 80 

CTAATAGGGA AACAAAATTG GGAAAAGCAG GTTTTGTGAC AGATAGGGGA AGACAGAAAG 3 5 40 

TGGTCTCTAT TGCAGACACC ACCAATCAAA AGGCTGAGTT ACAAGCTATC CTTATGGCCT 3 600 

TACAAGAGTC AGGACGGGAT GTAAACATAG TCACTGACTC TCAGTATGCT ATGGGAATAA 3 6 60 

TTCATTCACA GCCAGATAAA AGTGAATCAG AATTGGTGAG CCAAATAATA GAAGAGCTCA 3 72 0 

TAAAAAAGGA AAGAGTTTAT CTCTCTTGGG TACCTGCACA TAAAGGTATT GGAGGAAATG 37 80 

AGCAGGTAGA CAAATTAGTT AGCTCAGGAA TTAGAAAAAT ATTATTCCTA GATGGTATAG 3 840 

AAAAAGCCCA AGAAGATCAT GACAGATATC ACAGCAATTG GAAAGCAATG GCCAGTGATT 3 9 00 

TTAACTTACC CCCCATAGTG GCAAAAGAAA TAGTAGCCAG CTGTGACAAA TGCCAGCTAA 3 9 60 

AAGGGGAAGC CATGCATGGA CAGGTCAATT GTAGTCCAGG AGTGTGGCAA TTAGATTGTA 40 2 0 

CACACTTAGA GGGAAAAATC ATCCTTGTGG CGGTCCATGT GGCCAGTGGC TACTTAGAAG 40 80 

CAGAAGTTAT TCCTGCAGAG ACAGGACAGG AAACAGCATA TTTTATTTTA AAGTTAGCTG 4140 

GAAGATGGCC AGTAAAAGTT ATACACACTG ATAATGGATC CAATTTCACT AGTGCCACTG 42 0 0 

TAAAAGCAGC CTGTTGGTGG GCAAATATCA AACAGGAATT TGGGATACCC TACAATCCTC 42 60 

AAAGTCAGGG AGCAGTAGAG TCCATGAATA AAGAATTAAA GAAAATTATA GGACAAATCA 432 0 

GAGATCAAGC AGAACATCTA AAGACAGCAG TGCAAATGGC GGTTTTCATT CACAATTTTA 43 8 0 

AAAGAAAAGG GGGGATTGGG GGGTACACTG CAGGGGAAAG AATAATAGAC ATAATAGCAA 444 0 

CAGACATACA GACAACAAAT TTACAAACAC AAATTTTAAA AGTTCAAAAT TTTCGGGTTT 45 00 

ATTACAGAGA CAGCAGAGAT CCCATTTGGA AAGGACCAGC CAAACTTCTG TGGAAAGGAG 45 60 

AAGGGGCAGT GGTAATTCAA GATAACGGGG ATATAAAAGT AGTCCCACGT AGGAAAGCAA 462 0 

AAATAATTAG GGATTATGGA AAACAGATGG CAGGTGATGG TTGTGTGGCA AGTGGACAGG 4 680 

ATGAAAATCA GGAAATGGAA TAGCTTAGTA AAACATCATA TGTATGTGTC AAAAAAGGCA 47 4 0 

AAAGGATGGT ATTATAGACA TCATTATGAA ACACATCACC CAAAAATAAG TTCAGAAGTA 4800 

CATATCCCAG TAGGTCAGGC AAGATTAGTG ACAGTCACTT ATTGGGGGCT AACAACAGGA 4860 

GAACAGTCTT GGCATCTAGG ACATGGAGTA TCCATAGAAT GGAGACTAAG AAAATACAAG 49 2 0 

ACACAAGTTG ATCCTGAAAT GGCAGACAAG CTAATACATC TTCATTATTT TGATTGTTTT 49 80 

ACAGCCTCTG CCATAAGGCA AGCGGTCTTA GGGAGACCAG TATTACCTAG GTGTGAATAT 5040 

CCAGCAGGGC ACAAACAGGT AGGCACCCTA CAATATCTAG CACTAACAGC CTGGGTGGGA 510 0 

GCAAAGAAGA GAAAGCCACC CTTACCTAGT GTGACTAAGC TAACAGAAGA TAGATGGAAC 5160 

GAGCACCAGA AGATGCAGGG CCACAGAGGG AACCCTATAA TGAATGGGCA CTAGAATTAT 52 2 0 

TAGAAGAATT AAAAAATGAA GCTGTGCGCC ATTTTCCAAG GATTTGGCTA CATGGGTTAG 52 80 

GACAACACAT CTATAACACA TATGGAGACA CCTGGGAGGG GGTAGAGGCA ATTATCAGGA 5340 

TACTACAACA ATTACTGTTT ATCCATTATA GGATTGGCTG CCAGCACAGC AGAATAGGGA 54 0 0 
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TCACTCCTCA 
CCAGGAAGCC 
TGCTTATATT 
CAACGACGAA 
GTAAAACCTG 
GCAGTAATAG 
ATAAAACACA 
GGGGATGCAG 
AAGCTTGATC 
AGTATGGAGA 
AGAGGCTCAC 
AGTGCTATTA 
AATGCAAGAG 
CCCATTATGT 
TATGACAACA 
AACCACTGAG 
AGTACCAATC 
GACACAAGCT 
AGGCTTTGCC 
TGTGAGTACT 
AAATGGAAGC 
GGTGCAATGG 
ACAGGTGCAG 
TAGACAAGCA 
AGAGGAAATA 
TGAAGGAGAC 
TAACACTTCC 
GCCTTGTAGA 
ACCACCAATT 
TAGTGGTGGG 
TCTCTGGAGA 
ACCAGGTAAA 
TGCGCTGTTT 



AAGGAGAAGG 
AACCTAAAAC 
GCTTCACAAA 
GAACTCCTCA 
TATATATGCT 
TCTGGGCATT 
TAAGACAGAG 
AGTGGTTGGA 
AAGGTAATTG 
GAAGCAGAGA 
AACATCTGGG 
CCCAATGTAA 
GATATTATCA 
GTAACTATGC 
AGAGAACCAG 
CTAACAGATA 
AATGCCTATA 
TGTCCTAAGA 
ATTATGAAAT 
GTACAATGCA 
TTAAATACAG 
AATGAGACAG 
ATAGGACCTG 
TACTGTAATG 
AAGAAAATCC 
CTAGAAGTGA 
AAATTATTTA 
ATAAGACAGA 
CGGGGAGTTC 
CCTGACACCA 
CAAGAGTTGT 
GCTAAAAGAC 
CTTGGGTTTC 



AATGGAACCA 
AGCTTGCAAT 
GAAAGGCTTA 
GAGCAGTAAG 
GTCATTGGGA 
ACTATATAGA 
AATAAGAGAA 
TGGGGATGAA 
GGTCTGAACA 
CAACTCTTTT 
CCACACAAGC 
CTGAAAAATT 
GTCTGTGGGA 
TTTGTAACGA 
ACATAGGATA 
AAAAGAAGCA 
ATAAAACATA 
CTTCCTTTGA 
GTAATGAAGG 
CACATGGAAT 
ATGGAATTGT 
TGCCAATAAA 
CTATGACATT 
TCTCTAAAGA 
TGGGGAAAAA 
CACACTTAAT 
ATGAGGAATT 
TTGTAAATTT 
TTAACTGTAC 
AGGAAACAAT 
ATAAGTACAA 
GCACAGTGAG 
TTGGAGCAGC 
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GTAGATCCTA 
AATTGCTATT 
GGCATCTCAT 
AGTCATCAAG 
TTCATAGCGT 
GAATATAAGA 
AGAGAAGAAG 
GAGTGGTTGG 
ACATTGGGTA 
CTGTGCTTCA 
ATGTGTTCCT 
TAATATGTGG 
ACAGAGCTTA 
TAGCTATGGG 
CAAACAAATG 
AGTTTACTCT 
TAGGCTAATA 
GCCAATTCCA 
AAACTTTAGT 
AAAGCCAGTG 
TATTAGAAAT 
TTGTACAAGG 
TTATAACATA 
ACTATGGGAA 
CAACATAACC 
GTTCAATTGT 
ACTTAACGAG 
GTGGACAAGG 
CTCCAATATT 
AGTATATCCC 
AGTAGTTAGC 
TAGAGAAAAA 
AGGGAGCACT 



GATTAGAGCC 
GTAAAAGATG 
ATGGCAGGAA 
ATCTTATACC 
TAGGAGCAGC 
AAATAAAATT 
ATAGTGGCAA 
TTACTCTTCT 
ACAGTGTACT 
GATGCTAAAG 
ACTGATCCCA 
GAAAATAAAA 
AAGCCCTGTG 
GAGGAAAGGA 
AAAAATTGCT 
CTGTTTTATG 
AATTGTAATA 
ATACATTACT 
GGAAATGGAA 
ATATCCACTC 
GATAGTCACA 
CCAGGAAATA 
GAAAAAATAG 
CCAATGTGGA 
TTCAGGGCTC 
AGAGGAGAGT 
ACAGGTGAGC 
GTAGGAAAAG 
ACTGGACTGG 
TCAGGAGGAA 
ATAGAACCCA 
AGAGCAGCCT 
ATGGGCGCAG 
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CTGGAATCAT 546 0 
TTGCTATCAC 552 0 
GAAGCGGAGT 55 80 
AGAGCAGTAA 5 640 
AGTTAGCATA 570 0 
GCAGGAAAAA 5760 
TGAAAGTGAT 5 82 0 
ATCTTCTAGT 5 880 
ATGGGGTACC 5 940 
CCCATAGTAC 6000 
ATCCACAAGA 606 0 
TGGCAGACCA 612 0 
TTAAATTAAC 6180 
ACAATACAAA 62 40 
CATTCAATGC 63 00 
TAGAAGATGT 63 60 
CCACAGCTGT 642 0 
GTGCACCACC 64 80 
GCTGTACAAA 6540 
AGTTAATCCT 6 600 
GTAATCTGTT 6 6 60 
ATACAGGAGG 672 0 
TAGGAGACAT 67 80 
ATAGAACAAG 6840 
GAGAGAGGAA 6900 
TTTTCTATTG 69 6 0 
CTATTACTCT 7020 
GAATTTATGC 70 80 
TTCTAGAATA 7140 
ACATGGTTAA 72 00 
TAGGAGTAGC 72 60 
TTGGACTAGG 73 2 0 
CGTCAATAAC 73 80 
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GCTGACGGTA CAGGCCCGGA CATTATTATC 
GAGAGCAATA GAGGCGCAAC AACATTTGTT 
CCAGGCAAAA GTCCTTGCTA TAGAAAGATA 
GGGCTGCTCA GGAAAAACAA TATGCTATAC 
CAATACCTCT TATGATACAA TCTGGAATAA 
AAGAAACTAT TCAGGTGTCA TTTTTGGACT 
AAATGAGAAA TCACTCTTGG AATTGGATCA 
TACAAAATGG CTGTGGTATA TAAAAATAGC 
AAGAATCATA AGTATAGTAA TAACTATAAT 
TTCGTTGCAG ACCCTTATCC CAACAGCAAG 
AGGCGTTGGA GAGCAAGACA GAGGCAGATC 
TGTCTGGGAG GACCTCCGGA ACCTGTTGAT 
CTTGATACTG AGGAGGACTC TGGAACTCCT 
ACTGAATGAA CTCAGAACAC ACTTGTGGGG 
GGATAGTGCT ATCAGCTTGC TTAATACAAC 
GATTATAGAA TTAGCACAAA GAATAGGAAG 
ACAAGGCCTA GAAAGAGCAC TGATATAAGA 
TAGGATGGCC AGAAATCAGA GAAAGAATGA 
CAGCAGTAGG AGCAGGAGCA GCTTCTCAAG 
GAAATACTAG AGACAATAAT GAAAGTATAG 
AAGTAGGCTT TCCAGTACGC CCTCAGGTAC 
TTGATCTTTC CTTCTTTTTA AAAGATAAGG 
AAAGGCAAGA TATTCTAGAC CTCTGGATGT 
ATAACTACAC ACCAGGGCCA GGAATTAGAT 
TAGTACCATT GTCAGCTGAA GAAGTAGAAG 
TACACCCCAT ATGTCAACAT GGAGCAGATG 
TTGACAGCTC CCTAGCAAGA AGACATGTAG 
ACTGCTGACA AGGGACTTTA CTGCTGACAA 
GGACTTTCCA GGGAGGTGTG GTTGGGGGAG 
CCGCTTCTCG CTTGTACTGG GTCTCTCTTG 
GGG 
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TGGGATAGTG CAACAGCAGA ATATTCTGTT 7440 

GCAACTCTCA ATCTGGGGCA TTAAACAGCT 75 00 

CCTTAGGGAT CAGCAAATCC TAAGTCTATG 75 60 

CACTGTGCCT TGGAATGAGA CTTGGAGCAA 7 62 0 

TTTAACCTGG CAACAATGGG ATGAGAAAGT 7 680 

TATAGAACAG GCACAAGAAC AACAGAACAC 77 4 0 

ATGGGACAGT CTGTGGAGCT GGTTTGGTAT 780 0 

TATAATGATA GTAGCAGGCA TTGTAGGCAT 7 8 60 

AGCAAGAGTT AGGCAGGGAT ATTCTCCCCT 792 0 

GGGACCAGAC AGGCCAGAAG AAACAGAAGG 7 9 8 0 

CGTGCGATTA GTGAGCGGAT TCTCAGCTCT 8040 

CTTCCTCTAC CACCGCTTGA CAGACTCACT 8100 

GGGACAGAGT CTCAGCAGGG GACTGCAACT 816 0 

AATACTTGCA TATTGGGGAA AAGAGTTAAG 822 0 

AGCTATTGTA GTAGCAGAAG GAACAGATAG 82 8 0 

GGGAATATTA CACATACCTA GAAGAATCAG 83 4 0 

TGGGAAAGAT TTGGTCAAAG AGCAGCCTAG 840 0 

GAAGACAAAC GCAAGAACCA GCAGTAGAGC 8460 

ATCTAGCTAA TCGAGGGGCC ATCACCATAA 852 0 

CTTGGCTAGA AGCACAAGAA GAAGAAGAGG 85 8 0 

CATTAAGGCC AATAACCTAT AAACAGGCTT 864 0 

GGGGACTGGA AGGGCTAGTT TGGTCCAGAA 8700 

ATCACACACA AGGCATCCTC CCTGACTGGC 87 60 

ACCCCGTAAC CTTTGGATGG TGCTTCAAAC 882 0 

AGGCTAATGA AGGAGACAAC AATGCCCTCT 8880 

ATGATCATAA AGAAGTGTTG GTGTGGCGAT 894 0 

CAAGAGAGCT GCATCCGGAG TTTTACAAGA 9000 

GGGACTTTAT ACTTGGGGAC TTTCCGCCAG 90 60 

TGGCTTGCCC TCAGAGCTGC ATAAAAGCAG 912 0 

CTGGACCAGA TTAGAGTCTG GGAGCATATT 9180 

9183 
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(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

Ci) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 813 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2: 



TTGGAAGGGC 


TAGTTTGGTC 


CAGAAAAAGG 


CAAGATATTC 


TAGACCTCTG 


GATGTATCAC 


60 


ACACAAGGCA 


TCCTCCCTGA 


CTGGCATAAC 


TACACACCAG 


GGCCAGGAAT 


TAGATACCCC 


120 


GTAACCTTTG 


GATGGTGCTT 


CAAACTAGTA 


CCATTGTCAG 


CTGAAGAAGT 


AGAAGAGGCT 


180 


AATGAAGGAG 


ACAACAATGC 


CCTCTTACAC 


CCCATATGTC 


AACATGGAGG 


AGATGATGAT 


240 


CATAAAGAAG 


TGTTGGTGTG 


GCGATTTGAC 


AGCTCCCTAG 


CAAGAAGACA 


TGTAGCAAGA 


300 


GAGCTGCATC 


CGGAGTTTTA 


CAAGAACTGC 


TGACAAGGGA 


CTTTACTGCT 


GACAAGGGAC 


360 


TTTATACTTG 


GGGACTTTCC 


GCCAGGGACT 


TTCCAGGGAG 


GTGTGGTTGG 


GGGAGTGGCT 


420 


TGCCCTCAGA 


GCTGCATAAA 


AGCAGCCGCT 


TCTCGCTTGT 


ACTGGGTCTC 


TCTTGCTGGA 


480 


CTATACAGAT 


TAGAGCCTGG 


GAGCTCTCTG 


GCTAGCAGGG 


AACCCACTGC 


TTAAGCCTCA 


540 


ATAAATACAG 


CTTGCCTTGA 


GTGCTAAAGT 


GGTGTGTGCC 


CATCCATTCG 


GTAACTCTGG 


600 


TACCTAGAGA 


ATCCCTCAGA 


CCATCTAGAC 


TGAGTGAAAA 


ATCTCTAGCA 


GTGGCGCCCG 


660 


AACAGGGACT 


TAGTTGAAAA 


CGAAAGTAGA 


ACCGGAGGCT 


GAATCTCTCG 


ACGCAGGACT 


720 


CGGCTCGTTG 


GTGCACACAG 


CGAGAGGCGA 


GGCGGCGGAA 


GTGTGAGTAC 


GCAATTTTGA 


780 


CTGGCGGTGG 


CCAGAAAGTA 


GGAGAGAGGG 


AGG 






813 


(2) INFORMATIONS POUR 


LA SEQ ID NO : 3 : 









(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 153 9 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

( ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT : 1 . .153 6 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

ATG GGT GCG AGA GCG TCA GTG TTA AC A GGG GGA AAA TTA GAT CAA TGG 48 
Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gin Trp 
15 10 15 



GAA TCA ATT TAT TTG AGA CCA GGG GGA AAG AAA AAA TAC AGA ATG AAA 
Glu Ser lie Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 
20 25 30 



96 
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CAT TTA GTA TGG GCA AGC AGG GAG CTG GAA AGA TTC GCT TGT AAC CCA 144 

His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 

35 40 45 

GGT CTC ATG GAC ACA GCG GAC GGC TGT GCC AAG TTA CTA AAT CAA TTA 192 
Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gin Leu 
50 55 60 

GAA CCA GCT CTC AAG ACA GGG TCA GAA GAA CTG CGC TCT TTA TAT AAC 240 
Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 
65 70 75 80 

GCT CTA GCA GTT CTT TAT TGT GTC CAT AGT AGG ATA CAG ATA CAC AAC 2 88 

Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg lie Gin He His Asn 

85 90 95 

ACA CAG GAA GCT TTG GAC AAG ATA AAA GAG AAA CAG GAA CAG CAC AAG 33 6 

Thr Gin Glu Ala Leu Asp Lys He Lys Glu Lys Gin Glu Gin His Lys 
100 105 110 

CCC GAG CCA AAA AAC CCA GAA GCA GGG GCA GCG GCA GCA ACT GAT AGC 3 84 

Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 
115 120 125 

AAT ATC AGT AGG AAT TAT CCT CTA GTC CAG ACT GCT CAA GGA CAA ATG 432 
Asn He Ser Arg Asn Tyr Pro Leu Val Gin Thr Ala Gin Gly Gin Met 
130 135 140 

GTA CAT CAG CCG CTG ACA CCC AGA ACC TTA AAT GCT TGG GTG AAA GTG 48 0 

Val His Gin Pro Leu Thr Pro Arg Thr Leu Asn Ala Trp Val Lys Val 
145 150 155 160 

ATA GAG GAG AAG GCC TTT AGT CCA GAA GTA ATA CCA ATG TTT ATG GCC 52 8 

He Glu Glu Lys Ala Phe Ser Pro Glu Val He Pro Met Phe Met Ala 

165 170 175 

TTG TCA GAA GGG GCA ACG CCC TCA GAT CTA AAT ACT ATG TTA AAT ACA 57 6 

Leu Ser Glu Gly Ala Thr Pro Ser Asp Leu Asn Thr Met Leu Asn Thr 
180 185 190 

GTA GGG GGA CAT CAG GCA GCA ATG CAG ATG CTG AAG GAA GTC ATC AAT 62 4 

Val Gly Gly His Gin Ala Ala Met Gin Met Leu Lys Glu Val He Asn 
195 200 205 

GAG GAA GCA GCA GAC TGG GAT AGG ACA CAT CCA GTC CCT GTG GGA CCA 672 
Glu Glu Ala Ala Asp Trp Asp Arg Thr His Pro Val Pro Val Gly Pro 
210 215 220 

CTA CCC CCA GGG CAA CTG AGA GAC CCT AGA GGA AGT GAT ATA GCA GGA 72 0 

Leu Pro Pro Gly Gin Leu Arg Asp Pro Arg Gly Ser Asp He Ala Gly 
225 230 235 240 

ACA ACT AGC ACC CTG GCA GAA CAG GTG GCT TGG ATG ACT GCT AAT CCT 7 68 

Thr Thr Ser Thr Leu Ala Glu Gin Val Ala Trp Met Thr Ala Asn Pro 

245 250 255 

CCT GTT CCA GTA GGA GAT ATT TAT AGA AGA TGG ATA GTC CTG GGG TTA 816 
Pro Val Pro Val Gly Asp He Tyr Arg Arg Trp He Val Leu Gly Leu 
260 265 270 

AAC AGA ATT GTG AGA ATG TAT AGT CCT GTC AGC ATT CTA GAG ATC AAA 8 64 

Asn Arg He Val Arg Met Tyr Ser Pro Val Ser He Leu Glu He Lys 
275 280 285 
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CAA GGA CCA AAA GAA CCC TTC AGA GAC TAT GTA GAC AGG TTC TAC AAA 912 
Gin Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys 
290 295 300 

ACT CTA AGA GCA GAG CAG GCA ACA CAG GAA GTA AAG AAT TGG ATG ACA 9 60 

Thr Leu Arg Ala Glu Gin Ala Thr Gin Glu Val Lys Asn Trp Met Thr 
305 310 315 320 

GAA ACA CTC TTA GTA CAA AAT GCA AAC CCA GAT TGT AAA CAG CTC CTA 100 8 
Glu Thr Leu Leu Val Gin Asn Ala Asn Pro Asp Cys Lys Gin Leu Leu 

325 330 335 

AAA GCA TTA GGG CCA GGA GCT ACC TTA GAA GAG ATG ATG ACG GCC TGC 1056 
Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys 
340 345 350 

CAG GGA GTG GGG GGA CCA GCA CAT AAG GCA AGA GTG CTA GCA GAG GCT 1104 
Gin Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala 
355 360 365 

ATG TCA CAG GTG CAG CAG CCA ACA ACT ACT GTC TTT GCA CAA AGG GGA 1152 
Met Ser Gin Val Gin Gin Pro Thr Thr Ser Val Phe Ala Gin Arg Gly 
370 375 380 

AAC TTT AAA GGC ATA AGG AAA CCC ATT AAA TGT TTC AAT TGT GGC AAA 12 0 0 
Asn Phe Lys Gly lie Arg Lys Pro lie Lys Cys Phe Asn Cys Gly Lys 
385 390 395 400 

GAG GGC CAT TTG GCA AGA AAC TGT AAG GCC CCT AGA AGA GGA GGC TGT 12 4 8 
Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys 

405 410 415 

TGG AAG TGT GGG CAA GAA GGA CAT CAA ATG AAA GAT TGT AAA AAT GAA 129 6 
Trp Lys Cys Gly Gin Glu Gly His Gin Met Lys Asp Cys Lys Asn Glu 
420 425 430 

GGA AGA CAG GCT AAT TTT TTA GGG AAG AGC TGG TCT CCC TTC AAA GGG 1344 
Gly Arg Gin Ala Asn Phe Leu Gly Lys Ser Trp Ser Pro Phe Lys Gly 
435 440 445 

AGA CCA GGA AAC TTC CCC CAG ACA ACA ACA AGG AAA GAG CCC ACA GCC 13 92 
Arg Pro Gly Asn Phe Pro Gin Thr Thr Thr Arg Lys Glu Pro Thr Ala 
450 455 460 

CCG CCA CTA GAG ACT TAT GGG TTT CAG GAG GAG AAG AGC ACA CAG GGG 144 0 
Pro Pro Leu Glu Ser Tyr Gly Phe Gin Glu Glu Lys Ser Thr Gin Gly 
465 470 475 480 

AAG GAG ATG CAG GAG AAC CAG GAG AGG ACA GAG AAC TCT CTG TAC CCA 148 8 
Lys Glu Met Gin Glu Asn Gin Glu Arg Thr Glu Asn Ser Leu Tyr Pro 

485 490 495 

CCT TTA ACT TCC CTC AGA TCA CTC TTT GGC AAC GAC CCG TCA TCA CAG 153 6 
Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser Ser Gin 
500 505 510 

TAA 1539 



(2) INFORMATIONS POUR LA SEQ ID NO : 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 512 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 4: 

Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gin Trp 
15 10 15 

Glu Ser lie Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 
20 25 30 

His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 
35 40 45 

Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gin Leu 
50 55 60 

Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 
65 70 75 80 

Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg lie Gin lie His Asn 

85 90 95 

Thr Gin Glu Ala Leu Asp Lys lie Lys Glu Lys Gin Glu Gin His Lys 
100 105 110 

Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 
115 120 125 

Asn lie Ser Arg Asn Tyr Pro Leu Val Gin Thr Ala Gin Gly Gin Met 
130 135 140 

Val His Gin Pro Leu Thr Pro Arg Thr Leu Asn Ala Trp Val Lys Val 
145 150 155 160 

lie Glu Glu Lys Ala Phe Ser Pro Glu Val lie Pro Met Phe Met Ala 

165 170 175 

Leu Ser Glu Gly Ala Thr Pro Ser Asp Leu Asn Thr Met Leu Asn Thr 
180 185 190 

Val Gly Gly His Gin Ala Ala Met Gin Met Leu Lys Glu Val lie Asn 
195 200 205 

Glu Glu Ala Ala Asp Trp Asp Arg Thr His Pro Val Pro Val Gly Pro 
210 215 220 

Leu Pro Pro Gly Gin Leu Arg Asp Pro Arg Gly Ser Asp lie Ala Gly 
225 230 235 240 

Thr Thr Ser Thr Leu Ala Glu Gin Val Ala Trp Met Thr Ala Asn Pro 

245 250 255 

Pro Val Pro Val Gly Asp lie Tyr Arg Arg Trp lie Val Leu Gly Leu 
260 265 270 

Asn Arg lie Val Arg Met Tyr Ser Pro Val Ser lie Leu Glu lie Lys 
275 280 285 

Gin Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys 
290 295 300 

Thr Leu Arg Ala Glu Gin Ala Thr Gin Glu Val Lys Asn Trp Met Thr 
305 310 315 320 

Glu Thr Leu Leu Val Gin Asn Ala Asn Pro Asp Cys Lys Gin Leu Leu 

325 330 335 
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Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys 
340 345 350 

Gin Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala 
355 360 365 

Met Ser Gin Val Gin Gin Pro Thr Thr Ser Val Phe Ala Gin Arg Gly 
370 375 380 

Asn Phe Lys Gly lie Arg Lys Pro lie Lys Cys Phe Asn Cys Gly Lys 
385 390 395 400 

Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys 

405 410 415 

Trp Lys Cys Gly Gin Glu Gly His Gin Met Lys Asp Cys Lys Asn Glu 
420 425 430 

Gly Arg Gin Ala Asn Phe Leu Gly Lys Ser Trp Ser Pro Phe Lys Gly 
435 440 445 

Arg Pro Gly Asn Phe Pro Gin Thr Thr Thr Arg Lys Glu Pro Thr Ala 
450 455 460 

Pro Pro Leu Glu Ser Tyr Gly Phe Gin Glu Glu Lys Ser Thr Gin Gly 
465 470 475 480 

Lys Glu Met Gin Glu Asn Gin Glu Arg Thr Glu Asn Ser Leu Tyr Pro 

485 490 495 

Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser Ser Gin 
500 505 510 

(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 045 paires de bases 

(B) TYPE: nucleotide 

{€) NOMBRE DE BRINS : simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

( B ) EMPLACEMENT : 1 . .3042 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

TTT TTT AGG GAA GAG CTG GTC TCC CTT CAA AGG GAG ACC AGG AAA CTT 48 
Phe Phe Arg Glu Glu Leu Val Ser Leu Gin Arg Glu Thr Arg Lys Leu 
515 520 525 

CCC CCA GAC AAC AAC AAG GAA AGA GCC CAC AGC CCC GCC ACT AGA GAG 9 6 

Pro Pro Asp Asn Asn Lys Glu Arg Ala His Ser Pro Ala Thr Arg Glu 
530 535 540 

TTA TGG GTT TCA GGA GGA GAA GAG CAC ACA GGG GAA GGA GAT GCA GGA 144 
Leu Trp Val Ser Gly Gly Glu Glu His Thr Gly Glu Gly Asp Ala Gly 
545 550 555 560 
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GAA CCA GGA GAG GAC AGA GAA CTC TCT GTA CCC ACC TTT AAC TTC CCT 192 

Glu Pro Gly Glu Asp Arg Glu Leu Ser Val Pro Thr Phe Asn Phe Pro 

565 570 575 

CAG ATC ACT CTT TGG CAA CGA CCC GTC ATC ACA GTA AAA ATA GGG AAA 2 40 

Gin lie Thr Leu Trp Gin Arg Pro Val lie Thr Val Lys lie Gly Lys 
580 585 590 

GAA GTA AGA GAA GCT CTT TTA GAT ACA GGA GCT GAT GAT ACA GTA ATA 28 8 

Glu Val Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val lie 
595 600 605 

GAA GAG CTA CAA TTA GAG GGA AAA TGG AAA CCA AAA ATG ATA GGA GGA 33 6 

Glu Glu Leu Gin Leu Glu Gly Lys Trp Lys Pro Lys Met lie Gly Gly 
610 615 620 

ATT GGA GGA TTT ATC AAA GTG AGA CAA TAT GAT AAT ATA ACA GTA GAC 3 84 

lie Gly Gly Phe lie Lys Val Arg Gin Tyr Asp Asn lie Thr Val Asp 
625 630 635 640 

ATA CAG GGA AGA AAA GCA GTT GGT ACA GTA TTA GTA GGA CCA ACA CCT 43 2 

lie Gin Gly Arg Lys Ala Val Gly Thr Val Leu Val Gly Pro Thr Pro 

645 650 655 

GTT AAT ATT ATA GGA AGA AAT CTT TTA ACC CAG ATT GGC TGT ACT TTA 48 0 

Val Asn lie lie Gly Arg Asn Leu Leu Thr Gin lie Gly Cys Thr Leu 
660 665 670 

AAT TTT CCA ATA AGT CCT ATT GAA ACT GTA CCA GTA AAA TTA AAA CCA 52 8 

Asn Phe Pro lie Ser Pro lie Glu Thr Val Pro Val Lys Leu Lys Pro 
675 680 685 

GGA ATG GAT GGC CCA AAG GTA AAA CAA TGG CCT TTG ACA ACA GAA AAA 576 
Gly Met Asp Gly Pro Lys Val Lys Gin Trp Pro Leu Thr Thr Glu Lys 
690 695 700 

ATA GAG GCA TTA AGA GAA ATT TGT ACA GAA ATG GAA AAG GAA GGA AAA 624 
lie Glu Ala Leu Arg Glu lie Cys Thr Glu Met Glu Lys Glu Gly Lys 
705 710 715 720 

ATT TCT AGA ATA GGG CCT GAG AAT CCA TAT AAC ACT CCA ATT TTT GCT 672 
lie Ser Arg lie Gly Pro Glu Asn Pro Tyr Asn Thr Pro lie Phe Ala 

725 730 735 

ATA AAA AAG AAA GAT AGC ACT AAA TGG AGA AAA TTA GTA GAT TTC AGG 72 0 

lie Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg 
740 745 750 

GAA TTA AAT AAA AGG ACC CAA GAT TTT TGG GAA GTG CAG CTA GGA ATT 7 68 

Glu Leu Asn Lys Arg Thr Gin Asp Phe Trp Glu Val Gin Leu Gly lie 
755 760 765 

CCA CAT CCA GCA GGA TTA AAG CAG AAA AAA TCA GTG ACA GTT TTG GAT 816 
Pro His Pro Ala Gly Leu Lys Gin Lys Lys Ser Val Thr Val Leu Asp 
770 775 780 

GTA GGA GAT GCT TAT TTT TCA TGT CCC TTG GAC AAA GAT TTT AGA AAG 864 
Val Gly Asp Ala Tyr Phe Ser Cys Pro Leu Asp Lys Asp Phe Arg Lys 
785 790 795 800 

TAT ACA GCT TTT ACC ATA CCT AGT ATA AAC AAT GAG ACA CCT GGT ATT 912 
Tyr Thr Ala Phe Thr lie Pro Ser lie Asn Asn Glu Thr Pro Gly lie 

805 810 815 
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AGA TAG GAG TAT AAT GTG GTG CCA CAA GGC TGG AAA GGG TCA CCA GCA 9 60 

Arg Tyr Gin Tyr Asn Val Leu Pro Gin Gly Trp Lys Gly Ser Pro Ala 
820 825 830 

ATT TTT GAG AGT ACA ATG ACA AAA ATT CTA GAA CCA TTC AGA GAG AAA 100 8 
lie Phe Gin Ser Thr Met Thr Lys lie Leu Glu Pro Phe Arg Glu Lys 
835 840 845 

CAT CCA GAG ATA ATC ATT TAG CAG TAC ATG GAT GAC CTC TAT GTG GGA 105 6 
His Pro Glu lie lie lie Tyr Gin Tyr Met Asp Asp Leu Tyr Val Gly 
850 855 860 

TCT GAC TTA GAA CTA GCA CAA CAT AGA GAG GCA GTA GAA GAC CTC AGA 1104 
Ser Asp Leu Glu Leu Ala Gin His Arg Glu Ala Val Glu Asp Leu Arg 
865 870 875 880 

GAT CAT CTT TTG AAG TGG GGC TTT ACG ACC CCT GAC AAA AAA CAT CAG 1152 
Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Aso Lys Lys His Gin 

885 890 895 

AAG GAG CCC CCG TTC CTC TGG ATG GGA TAT GAA CTC CAT CCA GAC AAA 12 00 
Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys 
900 905 910 

TGG ACA GTC CAG CCA ATA AAG TTA CCA GAA AAG GAT GTA TGG ACT GTC 12 4 8 
Trp Thr Val Gin Pro lie Lys Leu Pro Glu Lys Aso Val Trp Thr Val 
915 920 ^ 925 

AAT GAT ATA CAG AAA TTA GTA GGA AAG TTA AAT TGG GCA AGT CAG ATC 12 9 6 
Asn Asp lie Gin Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gin lie 
930 935 940 

TAT CCA GGA ATC AGA GTA AAA CAG CTC TGT AAA TTA ATC AGA GGA GCC 13 44 
Tyr Pro Gly lie Arg Val Lys Gin Leu Cys Lys Leu lie Arg Gly Ala 
945 950 955 960 

AGA GCT TTG ACA GAA GTA GTC AAC TTT ACA GAA GAA GCA GAA TTA GAA 13 92 
Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu 

965 970 975 

CTA GCA GAA AAC AGG GAG ATA TTA AAA GAA CCC GTG CAT GGA GTC TAT 1440 
Leu Ala Glu Asn Arg Glu lie Leu Lys Glu Pro Leu His Gly Val Tyr 
980 985 990 

TAT GAC CCA GGA AAA GAA TTA GTA GCA GAA ATT CAA AAG CAA GGA CAA 1488 
Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu lie Gin Lys Gin Gly Gin 
995 1000 1005 

GGT CAG TGG ACA TAT CAG ATT TAT CAG GAG TTA CAT AAA AAT TTA AAA 153 6 
Gly Gin Trp Thr Tyr Gin lie Tyr Gin Glu Leu His Lys Asn Leu Lys 
1010 1015 1020 

ACA GGA AAG TAT GCA AAA ATG AGA TCT GCC CAT ACT AAT GAT ATA AAA 15 84 
Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp lie Lys 
1025 1030 1035 1040 

CAG TTA GTT GAA GTG GTA AGG AAA GTG GCA ACA GAA AGT ATA GTA ATT 163 2 
Gin Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser lie Val lie 

1045 1050 1055 

TGG GGA AAG ACT CCT AAA TTT AGA TTA CCA GTA CAA AAG GAA GTG TGG 16 80 
Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gin Lys Glu Val Trp 
1060 1065 1070 
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GAG GCA TGG TGG ACC GAT CAT TGG CAA GCA ACT TGG ATT CCT GAG TGG 172 8 
Glu Ala Trp Trp Thr Asp His Trp Gin Ala Thr Trp lie Pro Glu Trp 
1075 1080 1085 

GAA TTT GTC AAC ACT CCT CCC CTT GTA AAA TTA TGG TAT CAG TTA GAA 177 6 
Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gin Leu Glu 
1090 1095 1100 

AC A GAG CCA ATC AGT GGG GCA GAA ACT TTC TAT GTA GAT GGA GCA GCT 182 4 
Thr Glu Pro lie Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala 
1105 1110 1115 1120 

AAT AGG GAA ACA AAA TTG GGA AAA GCA GGT TTT GTG ACA GAT AGG GGA 1872 
Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly 

1125 1130 1135 

AGA CAG AAA GTG GTC TCT ATT GCA GAC ACC ACC AAT CAA AAG GCT GAG 192 0 
Arg Gin Lys Val Val Ser lie Ala Asp Thr Thr Asn Gin Lys Ala Glu 
1140 1145 1150 

TTA CAA GCT ATC CTT ATG GCC TTA CAA GAG TCA GGA CGG GAT GTA AAC 19 6 8 
Leu Gin Ala lie Leu Met Ala Leu Gin Glu Ser Gly Arg Asp Val Asn 
1155 1160 1165 

ATA GTC ACT GAC TCT CAG TAT GCT ATG GGA ATA ATT CAT TCA CAG CCA 2 016 
lie Val Thr Asp Ser Gin Tyr Ala Met Gly lie lie His Ser Gin Pro 
1170 1175 1180 

GAT AAA AGT GAA TCA GAA TTG GTG AGC CAA ATA ATA GAA GAG CTC ATA 2 0 64 
Asp Lys Ser Glu Ser Glu Leu Val Ser Gin lie lie Glu Glu Leu lie 
1185 1190 1195 1200 

AAA AAG GAA AGA GTT TAT CTC TCT TGG GTA CCT GCA CAT AAA GGT ATT 2112 
Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly lie 

1205 1210 1215 

GGA GGA AAT GAG CAG GTA GAC AAA TTA GTT AGC TCA GGA ATT AGA AAA 2160 
Gly Gly Asn Glu Gin Val Asp Lys Leu Val Ser Ser Gly lie Arg Lys 
1220 1225 1230 

ATA TTA TTC CTA GAT GGT ATA GAA AAA GCC CAA GAA GAT CAT GAC AGA 2 20 8 
lie Leu Phe Leu Asp Gly lie Glu Lys Ala Gin Glu Aso His Asp Arg 
1235 1240 1245 

TAT CAC AGC AAT TGG AAA GCA ATG GCC AGT GAT TTT AAC TTA CCC CCC 22 5 6 
Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro 
1250 1255 1260 

ATA GTG GCA AAA GAA ATA GTA GCC AGC TGT GAC AAA TGC CAG CTA AAA 2 3 04 
lie Val Ala Lys Glu lie Val Ala Ser Cys Asp Lys Cys Gin Leu Lys 
1265 1270 1275 1280 

GGG GAA GCC ATG CAT GGA CAG GTC AAT TGT AGT CCA GGA GTG TGG CAA 2 3 52 
Gly Glu Ala Met His Gly Gin Val Asn Cys Ser Pro Gly Val Trp Gin 

1285 1290 1295 

TTA GAT TGT ACA CAC TTA GAG GGA AAA ATC ATC CTT GTG GCG GTC CAT 2 40 0 
Leu Asp Cys Thr His Leu Glu Gly Lys lie lie Leu Val Ala Val His 
1300 1305 1310 

GTG GCC AGT GGC TAC TTA GAA GCA GAA GTT ATT CCT GCA GAG ACA GGA 2 44 8 
Val Ala Ser Gly Tyr Leu Glu Ala Glu Val lie Pro Ala Glu Thr Gly 
1315 1320 1325 
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CAG GAA ACA GCA TAT TTT ATT TTA AAG TTA GCT GGA AGA TGG CCA GTA 249 6 
Gin Glu Thr Ala Tyr Phe lie Leu Lys Leu Ala Gly Arg Trp Pro Val 
1330 1335 1340 

AAA GTT ATA CAC ACT GAT AAT GGA TCC AAT TTC ACT AGT GCC ACT GTA 2 544 
Lys Val lie His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val 
1345 1350 1355 1360 

AAA GCA GCC TGT TGG TGG GCA AAT ATC AAA CAG GAA TTT GGG ATA CCC 2 592 
Lys Ala Ala Cys Trp Trp Ala Asn lie Lys Gin Glu Phe Gly lie Pro 

1365 1370 1375 

TAC AAT CCT CAA AGT CAG GGA GCA GTA GAG TCC ATG AAT AAA GAA TTA 2 640 
Tyr Asn Pro Gin Ser Gin Gly Ala Val Glu Ser Met Asn Lys Glu Leu 
1380 1385 1390 

AAG AAA ATT ATA GGA CAA ATC AGA GAT CAA GCA GAA CAT CTA AAG ACA 2 688 
Lys Lys lie lie Gly Gin lie Arg Asp Gin Ala Glu His Leu Lys Thr 
1395 1400 1405 

GCA GTG CAA ATG GCG GTT TTC ATT CAC AAT TTT AAA AGA AAA GGG GGG 2 73 6 
Ala Val Gin Met Ala Val Phe lie His Asn Phe Lys Arg Lys Gly Gly 
1410 1415 1420 

ATT GGG GGG TAC ACT GCA GGG GAA AGA ATA ATA GAC ATA ATA GCA ACA 2 784 
lie Gly Gly Tyr Thr Ala Gly Glu Arg lie lie Asp lie lie Ala Thr 
1425 1430 1435 1440 

GAC ATA CAG ACA ACA AAT TTA CAA ACA CAA ATT TTA AAA GTT CAA AAT 2 83 2 
Asp lie Gin Thr Thr Asn Leu Gin Thr Gin lie Leu Lys Val Gin Asn 

1445 1450 1455 

TTT CGG GTT TAT TAC AGA GAC AGC AGA GAT CCC ATT TGG AAA GGA CCA 2 880 
Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro lie Trp Lys Gly Pro 
1460 1465 1470 

GCC AAA CTT CTG TGG AAA GGA GAA GGG GCA GTG GTA ATT CAA GAT AAC 2 92 8 
Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val lie Gin Asp Asn 
1475 1480 1485 

GGG GAT ATA AAA GTA GTC CCA CGT AGG AAA GCA AAA ATA ATT AGG GAT 2 97 6 
Gly Asp lie Lys Val Val Pro Arg Arg Lys Ala Lys lie lie Arg Asp 
1490 1495 1500 

TAT GGA AAA CAG ATG GCA GGT GAT GGT TGT GTG GCA AGT GGA CAG GAT 3 024 
Tyr Gly Lys Gin Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gin Asp 
1505 1510 1515 1520 

GAA AAT CAG GAA ATG GAA TAG 3 045 

Glu Asn Gin Glu Met Glu 

1525 



(2) INFORMATIONS POUR LA SEQ ID NO : 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1014 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 6: 

Phe Phe Arg Glu Glu Leu Val Ser Leu Gin Arg Glu Thr Arg Lys Leu 
15 10 15 
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Pro Pro 



Leu Trp 

Glu Pro 
50 

Gin lie 
65 

Glu Val 

Glu Glu 

lie Gly 

lie Gin 
130 

Val Asn 
145 

Asn Phe 

Gly Met 

lie Glu 

lie Ser 
210 

lie Lys 
225 

Glu Leu 

Pro His 

Val Gly 

Tvr Thr 
290 

Arg Tyr 
305 

lie Phe 
His Pro 
Ser Asp 



Asp Asn 
20 

Val Ser 
35 

Gly Glu 



Thr Leu 



Arg Glu 

Leu Gin 
100 

Gly Phe 
115 

Gly Arg 

lie lie 

Pro lie 

Asp Gly 
180 

Ala Leu 
195 

Arg lie 



Lys Lys 



Asn Lys 



Pro Ala 
260 

Asp Ala 
275 

Ala Phe 



Gin Tyr 



Gin Ser 



Glu lie 
340 

Leu Glu 
355 



Asn Lys 

Gly Gly 

Asp Arg 

Trp Gin 
70 

Ala Leu 
85 

Leu Glu 

lie Lys 

Lys Ala 

Gly Arg 
150 

Ser Pro 
165 

Pro Lys 

Arg Glu 

Gly Pro 

Asp Ser 
230 

Arg Thr 
245 

Gly Leu 

Tyr Phe 

Thr lie 

Asn Val 
310 

Thr Met 
325 

lie lie 
Leu Ala 



Glu Arg 

Glu Glu 
40 

Glu Leu 
55 

Arg Pro 

Leu Asp 

Gly Lys 

Val Arg 
120 

Val Gly 
135 

Asn Leu 

lie Glu 

Val Lys 

lie Cys 
200 

Glu Asn 
215 

Thr Lys 
Gin Asp 



Lys Gin 



Ser Cys 
280 

Pro Ser 
295 

Leu Pro 

Thr Lys 

Tyr Gin 

Gin His 
360 



34 

Ala His 
25 

His Thr 

Ser Val 

Val lie 

Thr Gly 
90 

Trp Lys 
105 

Gin Tyr 

Thr Val 

Leu Thr 

Thr Val 
170 

Gin Trp 
185 

Thr Glu 
Pro Tyr 



Trp Arg 



Phe Trp 
250 



Lys Lys 
265 



Pro Leu 



lie Asn 



Gin Gly 



lie Leu 
330 

Tyr Met 
345 

Arg Glu 



Ser Pro 

Gly Glu 

Pro Thr 
60 

Thr Val 
75 

Ala Asp 

Pro Lys 

Asp Asn 

Leu Val 
140 

Gin lie 
155 

Pro Val 

Pro Leu 

Met Glu 

Asn Thr 
220 

Lys Leu 
235 

Glu Val 

Ser Val 

Asp Lys 

Asn Glu 
300 

Trp Lys 
315 

Glu Pro 
Asp Asp 
Ala Val 



Ala Thr 
30 

Gly Asp 
45 

Phe Asn 



Lys lie 



Asp Thr 



Met lie 
110 

lie Thr 
125 

Gly Pro 



Gly Cys 



Lys Leu 



Thr Thr 
190 

Lys Glu 
205 

Pro lie 

Val Asp 

Gin Leu 

Thr Val 
270 

Asp Phe 
285 

Thr Pro 
Gly Ser 



Phe Arg 



Leu Tyr 
350 



Glu Asp 
365 



PCT/FR97/02227 

Arg Glu 

Ala Gly 

Phe Pro 

Gly Lys 
80 

Val lie 
95 

Gly Gly 



Val Asp 



Thr Pro 



Thr Leu 
160 

Lys Pro 
175 

Glu Lys 

Gly Lys 

Phe Ala 

Phe Arg 
240 

Gly lie 
255 

Leu Asp 

Arg Lys 

Gly lie 

Pro Ala 
320 

Glu Lys 
335 

Val Gly 
Leu Arg 



wo 98/26075 



PCT/FR97/02227 



35 

Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His Gin 
370 375 380 

Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys 
385 390 395 400 

Trp Thr Val Gin Pro lie Lys Leu Pro Glu Lys Asp Val Trp Thr Val 

405 410 415 

Asn Asp lie Gin Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gin lie 
420 425 430 

Tyr Pro Gly lie Arg Val Lys Gin Leu Cys Lys Leu lie Arg Gly Ala 
435 440 445 

Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu 
450 455 460 

Leu Ala Glu Asn Arg Glu lie Leu Lys Glu Pro Leu His Gly Val Tyr 
465 470 475 480 

Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu lie Gin Lys Gin Gly Gin 

485 490 495 

Gly Gin Trp Thr Tyr Gin lie Tyr Gin Glu Leu His Lys Asn Leu Lys 
500 505 510 

Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp lie Lys 
515 520 525 

Gin Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser lie Val He 
530 535 540 

Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gin Lys Glu Val Trp 
545 550 555 560 

Glu Ala Trp Trp Thr Asp His Trp Gin Ala Thr Trp He Pro Glu Trp 

565 570 575 

Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gin Leu Glu 
580 585 590 

Thr Glu Pro He Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala 
595 600 605 

Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly 
610 615 620 

Arg Gin Lys Val Val Ser He Ala Asp Thr Thr Asn Gin Lys Ala Glu 
625 630 635 640 

Leu Gin Ala He Leu Met Ala Leu Gin Glu Ser Gly Arg Asp Val Asn 

645 650 655 

He Val Thr Asp Ser Gin Tyr Ala Met Gly He He His Ser Gin Pro 
660 665 670 

Asp Lys Ser Glu Ser Glu Leu Val Ser Gin He He Glu Glu Leu He 
675 680 685 

Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly He 
690 695 700 

Gly Gly Asn Glu Gin Val Asp Lys Leu Val Ser Ser Gly He Arg Lys 
705 710 715 720 
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lie Leu Phe Leu Asp Gly lie Glu Lys Ala Gin Glu Asp His Asp Arg 

725 730 735 

Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro 
740 745 750 

lie Val Ala Lys Glu lie Val Ala Ser Cys Asp Lys Cys Gin Leu Lys 
755 760 765 

Gly Glu Ala Met His Gly Gin Val Asn Cys Ser Pro Gly Val Trp Gin 
770 775 780 

Leu Asp Cys Thr His Leu Glu Gly Lys lie lie Leu Val Ala Val His 
785 790 795 800 

Val Ala Ser Gly Tyr Leu Glu Ala Glu Val He Pro Ala Glu Thr Gly 

805 810 815 

Gin Glu Thr Ala Tyr Phe He Leu Lys Leu Ala Gly Arg Trp Pro Val 
820 825 830 

Lys Val He His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val 
835 840 845 

Lys Ala Ala Cys Trp Trp Ala Asn He Lys Gin Glu Phe Gly He Pro 
850 855 860 

Tyr Asn Pro Gin Ser Gin Gly Ala Val Glu Ser Met Asn Lys Glu Leu 
865 870 875 880 

Lys Lys He He Gly Gin He Arg Asp Gin Ala Glu His Leu Lys Thr 

885 890 895 

Ala Val Gin Met Ala Val Phe He His Asn Phe Lys Arg Lys Gly Gly 
900 905 910 

He Gly Gly Tyr Thr Ala Gly Glu Arg He He Asp He He Ala Thr 
915 920 925 

Asp He Gin Thr Thr Asn Leu Gin Thr Gin He Leu Lys Val Gin Asn 
930 935 940 

Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro He Trp Lys Gly Pro 
945 950 955 960 

Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val He Gin Asp Asn 

965 970 975 

Gly Asp He Lys Val Val Pro Arg Arg Lys Ala Lys He He Arg Asp 
980 985 990 

Tyr Gly Lys Gin Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gin Asp 
995 1000 1005 

Glu Asn Gin Glu Met Glu 
1010 

(2) INFORMATIONS POUR LA SEQ ID NO : 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 57 9 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
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( ix) CARACTERISTIQUE : 
(A) NOM/CLE: CDS 
{ B ) EMPLACEMENT : 1 . .576 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 7: 

ATG GAA AAC AGA TGG CAG GTG ATG GTT GTG TGG CAA GTG GAC AGG ATG 48 
Met Glu Asn Arg Trp Gin Val Met Val Val Trp Gin Val Asp Arg Met 
1015 1020 1025 1030 

AAA ATC AGG AAA TGG AAT AGC TTA GTA AAA CAT CAT ATG TAT GTG TCA 9 6 

Lys lie Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser 

1035 1040 1045 

AAA AAG GCA AAA GGA TGG TAT TAT AGA CAT CAT TAT GAA ACA CAT CAC 144 
Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His 
1050 1055 1060 

CCA AAA ATA AGT TCA GAA GTA CAT ATC CCA GTA GGT CAG GCA AGA TTA 192 
Pro Lys lie Ser Ser Glu Val His lie Pro Val Gly Gin Ala Arg Leu 
1065 1070 1075 

GTG ACA GTC ACT TAT TGG GGG CTA ACA ACA GGA GAA CAG TCT TGG CAT 240 
Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gin Ser Trp His 
1080 1085 1090 

CTA GGA CAT GGA GTA TCC ATA GAA TGG AGA CTA AGA AAA TAC AAG ACA 2 88 

Leu Gly His Gly Val Ser lie Glu Trp Arg Leu Arg Lys Tyr Lys Thr 
1095 1100 1105 1110 

CAA GTT GAT CCT GAA ATG GCA GAC AAG CTA ATA CAT CTT CAT TAT TTT 33 6 

Gin Val Asp Pro Glu Met Ala Asp Lys Leu lie His Leu His Tyr Phe 

1115 1120 1125 

GAT TGT TTT ACA GCC TCT GCC ATA AGG CAA GCG GTC TTA GGG AGA CCA 3 84 

Asp Cys Phe Thr Ala Ser Ala lie Arg Gin Ala Val Leu Gly Arg Pro 
1130 1135 1140 

GTA TTA CCT AGG TGT GAA TAT CCA GCA GGG CAC AAA CAG GTA GGC ACC 43 2 

Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gin Val Gly Thr 
1145 1150 1155 

CTA CAA TAT CTA GCA CTA ACA GCC TGG GTG GGA GCA AAG AAG AGA AAG 48 0 

Leu Gin Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys 
1160 1165 1170 

CCA CCC TTA CCT AGT GTG ACT AAG CTA ACA GAA GAT AGA TGG AAC GAG 52 8 

Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu 
1175 1180 1185 1190 

CAC CAG AAG ATG CAG GGC CAC AGA GGG AAC CCT ATA ATG AAT GGG CAC 57 6 

His Gin Lys Met Gin Gly His Arg Gly Asn Pro lie Met Asn Gly His 

1195 1200 1205 

TAG 579 



(2) INFORMATIONS POUR LA SEQ ID NO : 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 192 acides amines 

(B) TYPE: acide amine 

CD) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 8: 

Met Glu Asn Arg Trp Gin Val Met Val Val Trp Gin Val Asp Arg Met 
15 10 15 

Lys lie Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser 
20 25 30 

Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His 
35 40 45 

Pro Lys lie Ser Ser Glu Val His lie Pro Val Gly Gin Ala Arg Leu 
50 55 60 

Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gin Ser Trp His 
65 70 75 80 

Leu Gly His Gly Val Ser lie Glu Trp Arg Leu Arg Lys Tyr Lys Thr 

85 90 95 

Gin Val Asp Pro Glu Met Ala Asp Lys Leu lie His Leu His Tyr Phe 
100 105 110 

Asp Cys Phe Thr Ala Ser Ala lie Arg Gin Ala Val Leu Gly Arg Pro 
115 120 125 

Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gin Val Gly Thr 
130 135 140 

Leu Gin Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys 
145 150 155 160 

Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu 

165 170 175 

His Gin Lys Met Gin Gly His Arg Gly Asn Pro lie Met Asn Gly His 
180 185 190 



(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 28 8 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomigue) 

( ix ) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

( B ) EMPLACEMENT : 1 . .285 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 9: 

ATG GAA CGA GCA CCA GAA GAT GCA GGG CCA CAG AGG GAA CCC TAT AAT 48 
Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gin Arg Glu Pro Tyr Asn 
195 200 205 



GAA 
Glu 



TGG GCA CTA GAA TTA TTA GAA GAA 
Trp Ala Leu Glu Leu Leu Glu Glu 
210 215 



TTA AAA AAT GAA GCT GTG CGC 9 6 

Leu Lys Asn Glu Ala Val Arg 
220 
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CAT TTT CCA AGG ATT TGG CTA CAT GGG TTA GGA CAA CAC ATC TAT AAC 144 
His Phe Pro Arg He Trp Leu His Gly Leu Gly Gin His He Tyr Asn 
225 230 235 240 

ACA TAT GGA GAC ACC TGG GAG GGG GTA GAG GCA ATT ATC AGG ATA CTA 192 
Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala He lie Arg He Leu 

245 250 255 

CAA CAA TTA CTG TTT ATC CAT TAT AGG ATT GGC TGC CAG CAC AGC AGA 24 0 

Gin Gin Leu Leu Phe He His Tyr Arg He Gly Cys Gin His Ser Arg 
260 265 270 

ATA GGG ATC ACT CCT CAA AGG AGA AGG AAT GGA ACC ACT AGA TCC 2 85 

He Gly He Thr Pro Gin Arg Arg Arg Asn Gly Thr Ser Arg Ser 
275 280 285 

TAG 2 8 8 



(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 95 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gin Arg Glu Pro Tyr Asn 
15 10 15 

Glu Trp Ala Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg 
20 25 30 

His Phe Pro Arg He Trp Leu His Gly Leu Gly Gin His He Tyr Asn 
35 40 45 

Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala He He Arg He Leu 
50 55 60 

Gin Gin Leu Leu Phe He His Tyr Arg He Gly Cys Gin His Ser Arg 
65 70 75 80 

He Gly He Thr Pro Gin Arg Arg Arg Asn Gly Thr Ser Arg Ser 

85 90 95 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 252 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



{ ix) CARACTERISTIQUE : 
(A) NOM/CLE: CDS 
{ B ) EMPLACEMENT : 1 . .249 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID WO: 11: 

ATG CTG TCA TTG GGA TTC ATA GCG TTA GGA GCA GCA GTT AGC ATA OCA 48 
Met Leu Ser Leu Gly Phe lie Ala Leu Gly Ala Ala Val Ser lie Ala 

100 105 110 

GTA ATA GTC TGG GCA TTA CTA TAT AGA GAA TAT AAG AAA ATA AAA TTG 96 
Val lie Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys lie Lys Leu 
115 120 125 

CAG GAA AAA ATA AAA CAC ATA AGA GAG AGA ATA AGA GAA AGA GAA GAA 144 
Gin Glu Lys lie Lys His lie Arg Gin Arg lie Arg Glu Arg Glu Glu 
130 135 140 

GAT AGT GGC AAT GAA AGT GAT GGG GAT GCA GAG TGG TTG GAT GGG GAT 192 
Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp 
145 150 155 

GAA GAG TGG TTG GTT ACT CTT CTA TCT TCT AGT AAG CTT GAT CAA GGT 2 40 

Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gin Gly 
160 165 170 175 

AAT TGG GTC TGA 2 52 

Asn Trp Val 



C2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 83 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

Met Leu Ser Leu Gly Phe He Ala Leu Gly Ala Ala Val Ser He Ala 
1 5 10 15 

Val He Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys He Lys Leu 
20 25 30 

Gin Glu Lys He Lys His He Arg Gin Arg He Arg Glu Arg Glu Glu 
35 40 45 

Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp 
50 55 60 

Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gin Gly 
65 70 75 80 

Asn Trp Val 



(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 06 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
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( ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

{ B ) EMPLACEMENT : 1 , .303 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 

ATG GAA CCA GTA GAT CCT AGA TTA GAG CCC TGG AAT CAT CCA GGA AGC 4 8 

Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser 
85 90 95 

CAA CCT AAA ACA GCT TGC AAT AAT TGC TAT TGT AAA AGA TGT TGC TAT 9 6 

Gin Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr 
100 105 110 115 

CAC TGC TTA TAT TGC TTC ACA AAG AAA GGC TTA GGC ATC TCA TAT GGC 144 
His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly lie Ser Tyr Gly 

120 125 130 

AGG AAG AAG CGG AGT CAA CGA CGA AGA ACT CCT CAG AGC AGT AAG AGT 192 
Arg Lys Lys Arg Ser Gin Arg Arg Arg Thr Pro Gin Ser Ser Lys Ser 
135 140 145 

CAT CAA GAT CTT ATA CCA GAG CAG CCC TTA TCC CAA CAG CAA GGG GAC 240 
His Gin Asp Leu lie Pro Glu Gin Pro Leu Ser Gin Gin Gin Gly Asp 
150 155 160 

CAG ACA GGC CAG AAG AAA CAG AAG GAG GCG TTG GAG AGC AAG ACA GAG 2 88 

Gin Thr Gly Gin Lys Lys Gin Lys Glu Ala Leu Glu Ser Lys Thr Glu 
165 170 175 

GCA GAT CCG TGC GAT TAG 3 06 

Ala Asp Pro Cys Asp 

180 



(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

Ci) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 101 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser 
15 10 15 

Gin Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr 
20 25 30 

His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly lie Ser Tyr Gly 
35 40 45 

Arg Lys Lys Arg Ser Gin Arg Arg Arg Thr Pro Gin Ser Ser Lys Ser 
50 55 60 

His Gin Asp Leu lie Pro Glu Gin Pro Leu Ser Gin Gin Gin Gly Asp 
65 70 75 80 

Gin Thr Gly Gin Lys Lys Gin Lys Glu Ala Leu Glu Ser Lys Thr Glu 

85 90 95 



Ala Asp Pro Cys Asp 
100 
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(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 69 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

( ix ) CARACTERI STIQUE : 

(A) NOM/CLE: CDS 

( B ) EMPLACEMENT : 1 . .366 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 

ATG GCA GGA AGA AGC GGA GTC AAC GAC GAA GAA CTC CTC AGA GCA GTA 4 8 

Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val 
105 110 115 

AGA GTC ATC AAG ATC TTA TAC CAG AGC AGT TAT CCC AAC AGC AAG GGG 9 6 

Arg Val lie Lys lie Leu Tyr Gin Ser Ser Tyr Pro Asn Ser Lys Gly 
120 125 130 

ACC AGA CAG GCC AGA AGA AAC AGA AGG AGG CGT TGG AGA GCA AGA CAG 144 
Thr Arg Gin Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gin 
135 140 145 

AGG CAG ATC CGT GCG ATT AGT GAG CGG ATT CTC AGC TCT TGT CTG GGA 192 
Arg Gin lie Arg Ala lie Ser Glu Arg lie Leu Ser Ser Cys Leu Gly 
150 155 160 165 

GGA CCT CCG GAA CCT GTT GAT CTT CCT CTA CCA CCG CTT GAC AGA CTC 2 40 

Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu 

170 175 180 

ACT CTT GAT ACT GAG GAG GAC TCT GGA ACT CCT GGG ACA GAG TCT CAG 2 88 

Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gin 
185 190 195 

CAG GGG ACT GCA ACT ACT GAA TGA ACT CAG AAC ACA CTT GTG GGG AAT 33 6 

Gin Gly Thr Ala Thr Thr Glu * Thr Gin Asn Thr Leu Val Gly Asn 
200 205 210 

ACT TGC ATA TTG GGG AAA AGA GTT AAG GGA TAG 3 69 

Thr Cys lie Leu Gly Lys Arg Val Lys Gly 
215 220 



(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

Ci) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 122 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 16: 

Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val 
15 10 15 



Arg Val lie Lys lie Leu Tyr Gin Ser Ser Tyr Pro Asn Ser Lys Gly 
20 25 30 
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Thr Arg Gin Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gin 
35 40 45 

Arg Gin lie Arg Ala lie Ser Glu Arg lie Leu Ser Ser Cys Leu Gly 
50 55 60 

Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu 
65 70 75 80 

Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gin 

85 90 95 

Gin Gly Thr Ala Thr Thr Glu * Thr Gin Asn Thr Leu Val Gly Asn 
100 105 110 

Thr Cys lie Leu Gly Lys Arg Val Lys Gly 
115 120 

(2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2559 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



( ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .2556 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

ATG AAA GTG ATG GGG ATG CAG AGT GGT TGG ATG GGG ATG AAG AGT GGT 4 8 

Met Lys Val Met Gly Met Gin Ser Gly Trp Met Gly Met Lys Ser Gly 

125 130 135 

TGG TTA CTC TTC TAT CTT CTA GTA AGC TTG ATC AAG GTA ATT GGG TCT 9 6 

Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu lie Lys Val lie Gly Ser 
140 145 150 

GAA CAA CAT TGG GTA AC A GTG TAC TAT GGG GTA CCA GTA TGG AGA GAA 144 

Glu Gin His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu 
155 160 165 170 

GCA GAG AC A ACT CTT TTC TGT GOT TCA GAT GCT AAA GCC CAT AGT AC A 192 

Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr 

175 180 185 

GAG GCT CAC AAC ATC TGG GCC ACA CAA GCA TGT GTT CCT ACT GAT CCC 240 

Glu Ala His Asn lie Trp Ala Thr Gin Ala Cys Val Pro Thr Asp Pro 
190 195 200 

AAT CCA CAA GAA GTG CTA TTA CCC AAT GTA ACT GAA AAA TTT AAT ATG 2 88 

Asn Pro Gin Glu Val Leu Leu Pro Asn Val Thr Glu Lys Phe Asn Met 

205 210 215 

TGG GAA AAT AAA ATG GCA GAC CAA ATG CAA GAG GAT ATT ATC AGT CTG 33 6 

Trp Glu Asn Lys Met Ala Asp Gin Met Gin Glu Asp lie lie Ser Leu 
220 225 230 
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TGG GAA CAG AGC TTA AAG CCC TGT GTT AAA TTA ACC CCA TTA TGT GTA 3 84 

Trp Glu Gin Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val 
235 240 245 250 

ACT ATG CTT TGT AAC GAT AGC TAT GGG GAG GAA AGG AAC AAT ACA AAT 43 2 

Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn 

255 260 265 

ATG ACA ACA AGA GAA CCA GAC ATA GGA TAG AAA CAA ATG AAA AAT TGC 48 0 

Met Thr Thr Arg Glu Pro Asp lie Gly Tyr Lys Gin Met Lys Asn Cys 
270 275 280 

TCA TTC AAT GCA ACC ACT GAG CTA ACA GAT AAA AAG AAG CAA GTT TAG 52 8 

Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gin Val Tyr 

285 290 295 

TCT CTG TTT TAT GTA GAA GAT GTA GTA CCA ATC AAT GCC TAT AAT AAA 57 6 

Ser Leu Phe Tyr Val Glu Asp Val Val Pro lie Asn Ala Tyr Asn Lys 
300 305 310 

ACA TAT AGG CTA ATA AAT TGT AAT ACC ACA GCT GTG ACA CAA GCT TGT 62 4 

Thr Tyr Arg Leu lie Asn Cys Asn Thr Thr Ala Val Thr Gin Ala Cys 
315 320 325 330 

CCT AAG ACT TCC TTT GAG CCA ATT CCA ATA CAT TAG TGT GCA CCA CCA 67 2 

Pro Lys Thr Ser Phe Glu Pro lie Pro lie His Tyr Cys Ala Pro Pro 

335 340 345 

GGC TTT GCC ATT ATG AAA TGT AAT GAA GGA AAC TTT AGT GGA AAT GGA 72 0 

Gly Phe Ala lie Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly 
350 355 360 

AGC TGT ACA AAT GTG AGT ACT GTA CAA TGC ACA CAT GGA ATA AAG CCA 76 8 

Ser Cys Thr Asn Val Ser Thr Val Gin Cys Thr His Gly lie Lys Pro 

365 370 375 

GTG ATA TCC ACT CAG TTA ATC CTA AAT GGA AGC TTA AAT ACA GAT GGA 816 

Val lie Ser Thr Gin Leu lie Leu Asn Gly Ser Leu Asn Thr Asp Gly 
380 385 390 

ATT GTT ATT AGA AAT GAT AGT CAC AGT AAT CTG TTG GTG CAA TGG AAT 8 54 

lie Val lie Arg Asn Asp Ser His Ser Asn Leu Leu Val Gin Trp Asn 
395 400 405 410 

GAG ACA GTG CCA ATA AAT TGT ACA AGG CCA GGA AAT AAT ACA GGA GGA 912 

Glu Thr Val Pro lie Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly 

415 420 425 

CAG GTG CAG ATA GGA CCT GCT ATG ACA TTT TAT AAC ATA GAA AAA ATA 96 0 

Gin Val Gin lie Gly Pro Ala Met Thr Phe Tyr Asn lie Glu Lys lie 
430 435 440 

GTA GGA GAC ATT AGA CAA GCA TAG TGT AAT GTC TCT AAA GAA CTA TGG 1008 

Val Gly Asp lie Arg Gin Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp 

445 450 455 

GAA CCA ATG TGG AAT AGA ACA AGA GAG GAA ATA AAG AAA ATC CTG GGG 105 6 

Glu Pro Met Trp Asn Arg Thr Arg Glu Glu lie Lys Lys lie Leu Gly 
460 465 470 

AAA AAC AAC ATA ACC TTC AGG GCT GGA GAG AGG AAT GAA GGA GAC CTA 1104 

Lys Asn Asn lie Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu 
475 480 485 490 
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GAA GTG ACA CAC TTA ATG TTC AAT TGT AGA GGA GAG TTT TTC TAT TGT 1152 

Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys 

495 500 505 

AAC ACT TCC AAA TTA TTT AAT GAG GAA TTA CTT AAC GAG ACA GGT GAG 12 00 
Asn Thr Ser Lys Leu Phe Asn Glu Glu Leu Leu Asn Glu Thr Gly Glu 
510 515 520 

CCT ATT ACT CTG CCT TGT AGA ATA AGA CAG ATT GTA AAT TTG TGG ACA 12 48 
Pro lie Thr Leu Pro Cys Arg lie Arg Gin lie Val Asn Leu Trp Thr 
525 530 535 

AGG GTA GGA AAA GGA ATT TAT GCA CCA CCA ATT CGG GGA GTT CTT AAC 12 9 6 
Arg Val Gly Lys Gly lie Tyr Ala Pro Pro lie Arg Gly Val Leu Asn 
540 545 550 

TGT ACC TCC AAT ATT ACT GGA CTG GTT CTA GAA TAT AGT GGT GGG CCT 13 44 
Cys Thr Ser Asn lie Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro 
555 560 565 570 

GAC ACC AAG GAA ACA ATA GTA TAT CCC TCA GGA GGA AAC ATG GTT AAT 13 92 
Asp Thr Lys Glu Thr lie Val Tyr Pro Ser Gly Gly Asn Met Val Asn 

575 580 585 

CTC TGG AGA CAA GAG TTG TAT AAG TAC AAA GTA GTT AGC ATA GAA CCC 1440 
Leu Trp Arg Gin Glu Leu Tyr Lys Tyr Lys Val Val Ser lie Glu Pro 
590 595 600 

ATA GGA GTA GCA CCA GGT AAA GCT AAA AGA CGC ACA GTG AGT AGA GAA 148 8 
lie Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu 
605 610 615 

AAA AGA GCA GCC TTT GGA CTA GGT GCG CTG TTT CTT GGG TTT CTT GGA 153 6 
Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly 
620 625 630 

GCA GCA GGG AGC ACT ATG GGC GCA GCG TCA ATA ACG CTG ACG GTA CAG 15 8 4 
Ala Ala Gly Ser Thr Met Gly Ala Ala Ser lie Thr Leu Thr Val Gin 
635 640 645 650 

GCC CGG ACA TTA TTA TCT GGG ATA GTG CAA CAG CAG AAT ATT CTG TTG 163 2 
Ala Arg Thr Leu Leu Ser Gly lie Val Gin Gin Gin Asn lie Leu Leu 

655 660 665 

AGA GCA ATA GAG GCG CAA CAA CAT TTG TTG CAA CTC TCA ATC TGG GGC 168 0 
Arg Ala lie Glu Ala Gin Gin His Leu Leu Gin Leu Ser lie Trp Gly 
670 675 680 

ATT AAA CAG CTC CAG GCA AAA GTC CTT GCT ATA GAA AGA TAC CTT AGG 172 8 
lie Lys Gin Leu Gin Ala Lys Val Leu Ala lie Glu Arg Tyr Leu Arg 
685 690 695 

GAT CAG CAA ATC CTA AGT CTA TGG GGC TGC TCA GGA AAA ACA ATA TGC 177 6 
Asp Gin Gin lie Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr lie Cys 
700 705 710 

TAT ACC ACT GTG CCT TGG AAT GAG ACT TGG AGC AAC AAT ACC TCT TAT 1824 
Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr 
715 720 725 730 

GAT ACA ATC TGG AAT AAT TTA ACC TGG CAA CAA TGG GAT GAG AAA GTA 1872 
Asp Thr lie Trp Asn Asn Leu Thr Trp Gin Gin Trp Asp Glu Lys Val 

735 740 745 
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AGA AAC TAT TCA GGT GTC ATT TTT GGA CTT ATA GAA GAG GCA CAA GAA 192 0 
Arg Asn Tyr Ser Gly Val lie Phe Gly Leu lie Glu Gin Ala Gin Glu 
750 755 760 

CAA GAG AAC ACA AAT GAG AAA TCA CTC TTG GAA TTG GAT CAA TGG GAC 19 68 
Gin Gin Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gin Trp Asp 
765 770 775 

AGT CTG TGG AGC TGG TTT GGT ATT ACA AAA TGG CTG TGG TAT ATA AAA 2 016 
Ser Leu Trp Ser Trp Phe Gly lie Thr Lys Trp Leu Trp Tyr lie Lys 
780 785 790 

ATA GCT ATA ATG ATA GTA GCA GGC ATT GTA GGC ATA AGA ATC ATA AGT 2 0 64 
lie Ala lie Met lie Val Ala Gly He Val Gly He Arg lie He Ser 
795 800 805 810 

ATA GTA ATA ACT ATA ATA GCA AGA GTT AGG CAG GGA TAT TCT CCC CTT 2112 
He Val He Thr He He Ala Arg Val Arg Gin Gly Tyr Ser Pro Leu 

815 820 825 

TCG TTG CAG ACC CTT ATC CCA ACA GCA AGG GGA CCA GAC AGG CCA GAA 2160 
Ser Leu Gin Thr Leu He Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu 
830 835 840 

GAA ACA GAA GGA GGC GTT GGA GAG CAA GAC AGA GGC AGA TCC GTG CGA 220 8 
Glu Thr Glu Gly Gly Val Gly Glu Gin Asp Arg Gly Arg Ser Val Arg 
845 850 855 

TTA GTG AGC GGA TTC TCA GCT CTT GTC TGG GAG GAC CTC CGG AAC CTG 225 6 
Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu 
860 865 870 

TTG ATC TTC CTC TAG CAC CGC TTG ACA GAC TCA CTC TTG ATA CTG AGG 23 04 
Leu He Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu He Leu Arg 
875 880 885 890 

AGG ACT CTG GAA CTC CTG GGA CAG AGT CTC AGC AGG GGA CTG CAA GTA 2 3 52 
Arg Thr Leu Glu Leu Leu Gly Gin Ser Leu Ser Arg Gly Leu Gin Leu 

895 900 905 

CTG AAT GAA CTC AGA ACA CAC TTG TGG GGA ATA CTT GCA TAT TGG GGA 2 400 
Leu Asn Glu Leu Arg Thr His Leu Trp Gly He Leu Ala Tyr Trp Gly 
910 915 920 

AAA GAG TTA AGG GAT AGT GCT ATC AGC TTG CTT AAT ACA ACA GCT ATT 2 44 8 
Lys Glu Leu Arg Asp Ser Ala He Ser Leu Leu Asn Thr Thr Ala He 
925 930 935 

GTA GTA GCA GAA GGA ACA GAT AGG ATT ATA GAA TTA GCA CAA AGA ATA 2 49 6 
Val Val Ala Glu Gly Thr Asp Arg He He Glu Leu Ala Gin Arg He 
940 945 950 

GGA AGG GGA ATA TTA CAC ATA CCT AGA AGA ATC AGA CAA GGC CTA GAA 2 544 
Gly Arg Gly He Leu His He Pro Arg Arg He Arg Gin Gly Leu Glu 
955 960 965 970 



AGA GCA CTG ATA TAA 
Arg Ala Leu He 



2559 
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(2) INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 852 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 

Met Lys Val Met Gly Met Gin Ser Gly Trp Met Gly Met Lys Ser Gly 
15 10 15 

Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu lie Lys Val lie Gly Ser 
20 25 30 

Glu Gin His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu 
35 40 45 

Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr 
50 55 60 

Glu Ala His Asn lie Trp Ala Thr Gin Ala Cys Val Pro Thr Asp Pro 
65 70 75 80 

Asn Pro Gin Glu Val Leu Leu Pro Asn Val Thr Glu Lys Phe Asn Met 

85 90 95 

Trp Glu Asn Lys Met Ala Asp Gin Met Gin Glu Asp lie lie Ser Leu 
100 105 110 

Trp Glu Gin Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val 
115 120 125 

Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn 
130 135 140 

Met Thr Thr Arg Glu Pro Asp lie Gly Tyr Lys Gin Met Lys Asn Cys 
145 150 155 160 

Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gin Val Tyr 

165 170 175 

Ser Leu Phe Tyr Val Glu Asp Val Val Pro lie Asn Ala Tyr Asn Lys 
180 185 190 

Thr Tyr Arg Leu lie Asn Cys Asn Thr Thr Ala Val Thr Gin Ala Cys 
195 200 205 

Pro Lys Thr Ser Phe Glu Pro lie Pro lie His Tyr Cys Ala Pro Pro 
210 215 220 

Gly Phe Ala lie Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly 
225 230 235 240 

Ser Cys Thr Asn Val Ser Thr Val Gin Cys Thr His Gly lie Lys Pro 

245 250 255 

Val lie Ser Thr Gin Leu lie Leu Asn Gly Ser Leu Asn Thr Asp Gly 
260 265 270 

lie Val lie Arg Asn Asp Ser His Ser Asn Leu Leu Val Gin Trp Asn 
275 280 285 

Glu Thr Val Pro lie Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly 
290 295 300 
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Gin Val Gin lie Gly Pro Ala Met Thr Phe Tyr Asn lie Glu Lys lie 
305 310 315 320 

Val Gly Asp lie Arg Gin Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp 

325 330 335 

Glu Pro Met Trp Asn Arg Thr Arg Glu Glu lie Lys Lys lie Leu Gly 
340 345 350 

Lys Asn Asn lie Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu 
355 360 365 

Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys 
370 375 380 

Asn Thr Ser Lys Leu Phe Asn Glu Glu Leu Leu Asn Glu Thr Gly Glu 
385 390 395 400 

Pro lie Thr Leu Pro Cys Arg lie Arg Gin lie Val Asn Leu Trp Thr 

405 410 415 

Arg Val Gly Lys Gly lie Tyr Ala Pro Pro lie Arg Gly Val Leu Asn 
420 425 430 

Cys Thr Ser Asn lie Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro 
435 440 445 

Asp Thr Lys Glu Thr lie Val Tyr Pro Ser Gly Gly Asn Met Val Asn 
450 455 460 

Leu Trp Arg Gin Glu Leu Tyr Lys Tyr Lys Val Val Ser lie Glu Pro 
465 470 475 480 

lie Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu 

485 490 495 

Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly 
500 505 510 

Ala Ala Gly Ser Thr Met Gly Ala Ala Ser lie Thr Leu Thr Val Gin 
515 520 525 

Ala Arg Thr Leu Leu Ser Gly lie Val Gin Gin Gin Asn lie Leu Leu 
530 535 540 

Arg Ala lie Glu Ala Gin Gin His Leu Leu Gin Leu Ser lie Trp Gly 
545 550 555 560 

lie Lys Gin Leu Gin Ala Lys Val Leu Ala lie Glu Arg Tyr Leu Arg 

565 570 575 

Asp Gin Gin lie Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr lie Cys 
580 585 590 

Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr 
595 600 605 

Asp Thr lie Trp Asn Asn Leu Thr Trp Gin Gin Trp Asp Glu Lys Val 
610 615 620 

Arg Asn Tyr Ser Gly Val lie Phe Gly Leu lie Glu Gin Ala Gin Glu 
625 630 635 640 

Gin Gin Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gin Trp Asp 

645 650 655 
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Ser Leu Trp Ser Trp Phe Gly lie Thr Lys Trp Leu Trp Tyr lie Lys 
660 665 670 

lie Ala lie Met lie Val Ala Gly lie Val Gly lie Arg lie lie Ser 
675 680 685 

lie Val lie Thr lie lie Ala Arg Val Arg Gin Gly Tyr Ser Pro Leu 
690 695 700 

Ser Leu Gin Thr Leu lie Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu 
705 710 715 720 

Glu Thr Glu Gly Gly Val Gly Glu Gin Asp Arg Gly Arg Ser Val Arg 

725 730 735 

Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu 
740 745 750 

Leu lie Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu lie Leu Arg 
755 760 765 

Arg Thr Leu Glu Leu Leu Gly Gin Ser Leu Ser Arg Gly Leu Gin Leu 
770 775 780 

Leu Asn Glu Leu Arg Thr His Leu Trp Gly lie Leu Ala Tyr Trp Gly 
785 790 795 800 

Lys Glu Leu Arg Asp Ser Ala lie Ser Leu Leu Asn Thr Thr Ala lie 

805 810 815 

Val Val Ala Glu Gly Thr Asp Arg lie lie Glu Leu Ala Gin Arg He 
820 825 830 

Gly Arg Gly lie Leu His He Pro Arg Arg He Arg Gin Gly Leu Glu 
835 840 845 

Arg Ala Leu He 
850 

(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 639 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

( B ) EMPLACEMENT : 1 . .636 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

ATG GGA AAG ATT TGG TCA AAG AGO AGC CTA GTA GGA TGG CCA GAA ATC 48 
Met Gly Lys He Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu He 
855 860 865 

AGA GAA AGA ATG AGA AGA CAA ACG CAA GAA CCA GCA GTA GAG CCA GCA 9 6 

Arg Glu Arg Met Arg Arg Gin Thr Gin Glu Pro Ala Val Glu Pro Ala 
870 875 880 
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GTA GGA OCA GGA GCA GCT TCT CAA GAT CTA GCT AAT CGA GGG GCC ATC 144 

Val Gly Ala Gly Ala Ala Ser Gin Asp Leu Ala Asn Arg Gly Ala lie 

885 890 895 900 

ACC ATA AGA AAT ACT AGA GAC AAT AAT GAA AGT ATA GCT TGG CTA GAA 192 

Thr lie Arg Asn Thr Arg Asp Asn Asn Glu Ser lie Ala Trp Leu Glu 

905 910 915 

GCA CAA GAA GAA GAA GAG GAA GTA GGC TTT CCA GTA CGC CCT CAG GTA 2 40 

Ala Gin Glu Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gin Val 
920 925 930 

CCA TTA AGG CCA ATA ACC TAT AAA CAG GCT TTT GAT CTT TCC TTC TTT 2 88 

Pro Leu Arg Pro lie Thr Tyr Lys Gin Ala Phe Asp Leu Ser Phe Phe 
935 940 945 

TTA AAA GAT AAG GGG GGA CTG GAA GGG CTA GTT TGG TCC AGA AAA AGG 33 6 

Leu Lys Asp Lys Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg 
950 955 960 

CAA GAT ATT CTA GAC CTC TGG ATG TAT CAC ACA CAA GGC ATC CTC CCT 3 84 

Gin Asp lie Leu Asp Leu Trp Met Tyr His Thr Gin Gly lie Leu Pro 

965 970 975 980 

GAC TGG CAT AAC TAC ACA CCA GGG CCA GGA ATT AGA TAG CCC GTA ACC 43 2 

Asp Trp His Asn Tyr Thr Pro Gly Pro Gly lie Arg Tyr Pro Val Thr 

985 990 995 

TTT GGA TGG TGC TTC AAA CTA GTA CCA TTG TCA GCT GAA GAA GTA GAA 4 80 

Phe Gly Tro Cys Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu 
1000 1005 1010 

GAG GCT AAT GAA GGA GAC AAC AAT GCC CTC TTA CAC CCC ATA TGT CAA 52 8 

Glu Ala Asn Glu Gly Asp Asn Asn Ala Leu Leu His Pro lie Cys Gin 
1015 1020 1025 

CAT GGA GCA GAT GAT GAT CAT AAA GAA GTG TTG GTG TGG CGA TTT GAC 57 6 

His Gly Ala Asp Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp 
1030 1035 1040 

AGC TCC CTA GCA AGA AGA CAT GTA GCA AGA GAG CTG CAT CCG GAG TTT 624 

Ser Ser Leu Ala Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe 

1045 1050 1055 1060 

TAC AAG AAC TGC TGA 63 9 

Tyr Lys Asn Cys 



(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 212 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 20: 

Met Gly Lys lie Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu lie 
15 10 15 



Arg Glu Arg Met Arg Arg Gin Thr Gin Glu Pro Ala Val Glu Pro Ala 
20 25 30 
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Val Gly Ala Gly Ala Ala Ser Gin Asp Leu Ala Asn Arg Gly Ala He 
35 40 45 

Thr lie Arg Asn Thr Arg Asp Asn Asn Glu Ser He Ala Trp Leu Glu 
50 55 60 

Ala Gin Glu Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gin Val 
65 70 75 80 

Pro Leu Arg Pro He Thr Tyr Lys Gin Ala Phe Asp Leu Ser Phe Phe 

85 90 95 

Leu Lys Asp Lys Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg 
100 105 110 

Gin Asp He Leu Asp Leu Trp Met Tyr His Thr Gin Gly He Leu Pro 
115 120 125 

Asp Trp His Asn Tyr Thr Pro Gly Pro Gly He Arg Tyr Pro Val Thr 
130 135 140 

Phe Gly Trp Cys Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu 
145 150 155 160 

Glu Ala Asn Glu Gly Asp Asn Asn Ala Leu Leu His Pro He Cys Gin 

165 170 175 

His Gly Ala Asp Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp 
180 185 190 

Ser Ser Leu Ala Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe 
195 200 205 

Tyr Lys Asn Cys 
210 

(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 0 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 21: 

ATTGCGTACT CACACTTCCG 2 0 

(2) INFORMATIONS POUR LA SEQ ID NO : 22: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
{A} LONGUEUR: 17 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



wo 98/26075 



52 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22 
GGCAAGCAGG GAGCTGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 23: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
{A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2 3 
TCCTTGAGCA GTCTGGAC 

(2) INFORMATIONS POUR LA SEQ ID NO : 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2 4 

GAACAGGAGG ATTAGCAG 

(2) INFORMATIONS POUR LA SEQ ID NO : 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2 5 
AGCAGAGGCT ATGTCACA 

(2) INFORMATIONS POUR LA SEQ ID NO : 26: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2 6 



TGTAAGGCCC CTAGAAGAG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

{C) NOMBRE DE BRINS : simple 
{D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2 7 
ACAGAGAACT CTCTGTAC 

(2) INFORMATIONS POUR LA SEQ ID NO : 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2 8 
AAGAAAAGCA GTTGGTAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 29 
TTTCTTCCCT GTATGTC 

(2) INFORMATIONS POUR LA SEQ ID NO : 30: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 3 0 



GTTATATGGA TTCTCAGG 
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(2) INFORMATIONS POUR LA SEQ ID NO : 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleiqiae 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 31: 

TGGCAGCACA TTATACTGG 19 

(2) INFORMATIONS POUR LA SEQ ID NO : 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 3 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleiq^ae 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 32: 
ATCATTTACC AGTACATGGA CGA 

(2) INFORMATIONS POUR LA SEQ ID NO : 33: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 

TGTCAGGGGT CGTAAAGC 

(2) INFORMATIONS POUR LA SEQ ID NO : 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 34: 
TCCTCTGGAT GGGATATG 

(2) INFORMATIONS POUR LA SEQ ID NO : 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 18 paires de bases 
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(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35 
TCTATCCAGG AATCAGAG 

(2) INFORMATIONS POUR LA SEQ ID NO : 36: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 3 6 
AATGAGATCT GCCCATAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 37: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 3 7 
TGACAGATAG GGGAAGAC 

(2) INFORMATIONS POUR LA SEQ ID NO : 38: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 3 8 

AACCGCCATT TGCACTGC 

(2) INFORMATIONS POUR LA SEQ ID NO : 39: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 3 9 
ACATGGACCG CCACAAGG 

(2) INFORMATIONS POUR LA SEQ ID NO : 40: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc =^ "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 4 0 

AGCAACAGAC ATACAGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 41: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 41 

AAAGTAGTCC CACGTAGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 42: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 42 
ATATCCCAGT AGGTCAGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 43: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



wo 98/26075 



57 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 43 
TCTAGCACTA ACAGCCTG 

(2) INFORMATIONS POUR LA SEQ ID NO: 44: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 44 
ACTCTTACTG CTCTGAGG 

(2) INFORMATIONS POUR LA SEQ ID NO : 45: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 45 
CCATAGTACA CTGTTACC 

(2) INFORMATIONS POUR LA SEQ ID NO: 46: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 4 6 
CATAGCTATC GTTACAAAGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 47: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 47 
TCATAATGGC AAAGCCTG 

(2) INFORMATIONS POUR LA SEQ ID NO: 48: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 48 
CTATTCCACA TTGGTTCC 

(2) INFORMATIONS POUR LA SEQ ID NO : 49: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 49 
ATTCTAGAAC CAGTCCAG 

(2} INFORMATIONS POUR LA SEQ ID NO : 50: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 0 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 50 
CCTTAGGGAT CAGCAAATCC 

(2) INFORMATIONS POUR LA SEQ ID NO : 51: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 51: 
TGGGACAGTC TGTGGAGC 18 
{2) INFORMATIONS POUR LA SEQ ID NO: 52: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 52: 

TTCTCAGCTC TTGTCTGG 18 

(2) INFORMATIONS POUR LA SEQ ID NO : 53: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleicjue 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 53: 

ATTAAGCAAG CTGATAGC 18 

(2) INFORMATIONS POUR LA SEQ ID NO: 54: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 54: 

TGTGCTTCTA GCCAAG 16 

(2) INFORMATIONS POUR LA SEQ ID NO : 55: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 55: 

GCTCCATGTT GACATATG 18 
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(2) INFORMATIONS POUR LA SEQ ID NO : 56: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 56: 

AGAGAGACCC AGTACAAG 18 

(2) INFORMATIONS POUR LA SEQ ID NO: 57: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc ^ "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 57: 

ATAAAAGCAG CCGCTTCTCG 2 0 

(2) INFORMATIONS POUR LA SEQ ID NO: 58: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 58: 

Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly Gin Val Gin lie Gly Pro 
15 10 15 

Ala Met Thr Phe Tyr Asn lie Glu Lys lie Val Gly Asp lie Arg Gin 
20 25 30 

Ala Tyr Cys 
35 

(2) INFORMATIONS POUR LA SEQ ID NO: 59: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 5 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 59: 

Cys His Arg Pro Gly Asn Asn Thr Arg Gly Glu Val Gin lie Gly Pro 
15 10 15 
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Gly Met Thr Phe Tyr Asn lie Glu Asn Val Tyr Gly Asp Thr Arg Ser 
20 25 30 

Ala Tyr Cys 
35 

(2) INFORMATIONS POUR LA SEQ ID NO: 60: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 60: 

Cys lie Arg Pro Gly Asn Arg Thr Tyr Arg Asn Leu Gin lie Gly Pro 
15 10 15 

Gly Met Thr Phe Tyr Asn Val Glu lie Ala Thr Gly Asp lie Arg Lys 
20 25 30 

Ala Phe Cys 
35 

(2) INFORMATIONS POUR LA SEQ ID NO : 61: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 61: 

Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Val Arg lie Gly Pro 
15 10 15 

Gly Gin Ala Phe Tyr Ala Thr Gly Asp lie lie Gly Asp lie Arg Gin 
20 25 30 



Ala His Cys 
35 
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REVENPICATIONS 
1°) Souche de VIH-1 non-M non-O, presentant les caracteristiques 
morphologiques et immunologiques du retrovirus deposes a la Collection Nationale de 
Cultures de Microorganismes tenue par I'lnstitut Pasteur sous le numero 1-1753 
5 (denomme YBF30) le 2 juillet 1996. 

2°) Sequences d'acide nucleique, caracterisees en ce qu'elles sont 
issues de la souche selon la revendication 1 . 

3°) Sequence d'acide nucleique selon la revendication 2, caracterisee 
en ce qu'elle est selectionnee dans le groupe constitue par les sequences suivantes : la 
10 sequence nucleotidique complete de la souche selon la revendication 1 (SEQ ID N°l) 
ainsi que des fragments d'acide nucleique, issus de ladite souche : (SEQ ID N^2), 
(SEQ ID N°3), (SEQ ID N°5), (SEQ ID N°7), (SEQ ID N°9), (SEQ ID N°ll), (SEQ 
ID N°13X (SEQ ID N°15), (SEQ ID N°17), (SEQ ID N°19) et les SEQ ID N^21-57, 
ainsi que toute sequence, qui n'est pas identique a Tune des sequences nucleotidiques 
15 ci-dessus ou n'est pas complementaire de I'une de ces sequences, mais est neanmoins 
susceptible de s'hybrider avec une sequence nucleique issue d'un virus VTH-1 non-M, 
non-O. 

4^) Oligonucleotide, caracterise en ce qu'il est selectionne parmi les 
sequences SEQ ID N°21 a 57 et en ce qu'il est apte a servir d' amorce et/ou de sonde 
20 pour la detection d'un VTH-l selon la revendication 1 ou la revendication 5. 

50) VTH-l, caracterises en ce qu'ils sont distincts a la fois du groupe 
M et du groupe O et presentent les caracteristiques suivantes : 

* peu ou pas de reactivite serologique vis-a-vis des proteines des 
groupes M et O et forte reactivite serologique vis-a-vis des proteines issues de la 

25 souche YBF30 selon la revendication 1 ou de la souche SIV CPZGAB ; 

* absence d' amplification genomique a I'aide des amorces des 
regions env et gag des VTH-l des groupes M et O ; 

* amplification genomique en presence des amorces issues de la 
souche YBF30, selon la revendication 4 ; et 

30 * homologie des produits du gene d'enveloppe superieure a 70 % 

vis-a-vis de la souche YBF30. 



wo 98/26075 



PCT/FR97/02227 



64 

6°) Precede de diagnostic in vitro d'un VIH-1 de groupe non-M non- 
O, par hybridation et/ou amplification genique, realise a partir d'un echantilion biolo- 
gique (serum ou lymphocyte circulant), lequel procede est caracterise en ce qu'il 
comprend : 

5 . une etape d'extraction de Tacide nucleique a detecter, appartenant 

au genome du virus, eventuellement present dans I'echantillon biologique et, le cas 
echeant, une etape de traitement de Tacide nucleique, a Taide d'une transcriptase inver- 
se, si ce dernier est sous forme d' ARN, 

. au moins un cycle comprenant les etapes de denaturation de I'acide 
10 nucleique, d' hybridation avec au moins une sequence selon la revendication 3 ou la 
revendication 4 et eventuellement, si necessaire, extension de I'hybride forme, en 
presence de reactifs convenables (agent de polymerisation, tel qu'ADN polymerase et 
dNTP) et 

. une etape de detection de la presence eventuelle de I'acide 

15 nucleique appartenant au genome d'un virus de type VTH-l de groupe non-M non-O. 

7^) Peptide, caracterise en ce qu'il est susceptible d'etre exprime par 
une souche de VIH-1 non-M non-O selon la revendication 1 ou la revendication 5 ou a 
I'aide d'une sequence nucleotidique selon la revendication 3 et en ce qu'il est apte (1) a 
etre reconnu par des anticorps induits par un VIH-1 non-M non-0 selon la revendica- 

20 tion 1 ou la revendication 5 ou un variant de celui-ci et presents dans un echantilion 
biologique obtenu apres une infection par une souche de VTH- 1 non-M non-0 et/ou (2) 
a induire la production d' anticorps anti- VIH-1 non-M non-O. 

8°) Peptide selon la revendication 7, caracterise en ce qu'il est choisi 
parmi celui exprime par le gene gag (SEQ ID N° 4), celui exprime par le gene pol 

25 (SEQ ID N° 6), celui exprime par le gene v//(SEQ ID N"* 8), celui exprime par le gene 
vpr (SEQ ID W 10), celui exprime par le gene vpu (SEQ ID N° 12), celui exprime par 
le gene tat (SEQ ID N° 14), celui exprime par le gene rev (SEQ ID W 16), celui 
exprime par le gene env (SEQ ID N° 18) ou I'un de ses fi-agments, tels qu'un fragment 
de la region de la boucle V3 (SEQ ID N° 58) et celui exprime par le gene w^/(SEQ ID 

30 N° 20) ou un fragment de ceux-ci aptes a reconnaitre les anticorps produits lors d'une 
infection par un VIH-1 selon la revendication 1 ou la revendication 5. 



wo 98/26075 



PCT/FR97/02227 



65 

9°) Compositions immunogenes comprenant un ou plusieurs produits 
de traduction des sequences nucleotidiques selon la revendication 3 et/ou Tun des pep- 
tides selon la revendication 7 ou la revendication 8. 

10*^) Anticorps diriges centre Fun ou plusieurs des peptides selon la 
5 revendication 7 ou la revendication 8. 

ir) Methode de diagnostic in vitro d'un VIH-1 non-M non-O, 
caracterisee en ce qu'elle comprend la mise en contact d'un echantillon biologique 
preleve chez un patient, avec des anticorps selon la revendication 10, eventuellement 
associes a des anticorps anti-SIV CPZGAB et la detection des complexes immuno- 
10 logiques formes entre les antigenes de VEH-l, eventuellement presents dans 
r echantillon biologique et lesdits anticorps. 

ll'') Reactif de diagnostic d'un VTH-l non-M non-O, caracterise en 
ce qu'il comprend une sequence selon Tune quelconque des revendications 3, 4, 7 ou 
8. 

15 13°) Procede de criblage et de typage d'un VTH-l non-M non-O, 

caracterise en ce qu'il comprend la mise en contact de Tun quelconque des fragments 
nucleotidiques selon la revendication 3 ou la revendication 4 avec I'acide nucleique du 
virus a typer et la detection de I'hybride forme. 

M"") Trousse de diagnostic de VTH-l non-M non-O, caracterisee en 

20 ce qu'elle inclut au moins un reactif selon la revendication 12. 
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